ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

20 小时前

4000 亿参数“生啃”成功！iPhone 17 Pro 挑战本地运行超大模型，但速度只有 0.6 token

智能手机的算力极限在哪里?苹果的最新旗舰iPhone17Pro刚刚给出了一个既令人震撼又略显尴尬的答案。

3月23日，拥有 4000亿参数 的大语言模型在iPhone17Pro上成功跑通。要知道，即便经过量化压缩，此类模型通常也需要至少200GB 的内存才能运行，而iPhone17Pro的硬件配置仅为12GB LPDDR5X 内存。

技术“黑科技”: 闪存流转与混合专家模型

在内存容量严重不足的情况下，这次“不可能的任务”主要依靠两个技术路径实现:

SSD 强行“扩容”: 借助 Flash-MoE 开源项目，设备直接从固态硬盘（SSD）向 GPU 流式传输数据，突破了物理内存的上限。

MoE 架构优势: “MoE”代表混合专家模型（Mixture of Experts），这意味着系统在生成每个单词时，只需要调用4000亿参数中的一小部分，而非全量负载。

速度硬伤:每两秒蹦出一个词

虽然“跑通了”，但实际体验距离“可用”还有巨大的鸿沟。实测显示:

生成速度: 仅为 0.6Token/秒。换句话说，大约每1.5到2秒才能生成一个单词。

功耗压力: 这种高强度的本地运算会极速消耗手机的电池寿命，发热情况也不容小觑。

行业启示:本地大模型的“奇点”将至?

尽管目前的生成速度让人“抓狂”，但这次演示的象征意义远大于实用价值。它证明了在手机端本地运行顶级规模大模型并非死路一条。

隐私护城河: 本地运行意味着数据无需上传云端，能够提供极高的隐私保护。

离线可行性: 在无网络环境下获取顶级 AI 的回复正在成为可能。

正如业内评价，“能跑起来”和“能流畅使用”是两码事。但随着算法优化与硬件迭代，当0.6token 进化到60token 时，智能手机将真正进化为随身携带的“超级大脑”。

via AI新闻资讯 (author: AI Base)

20 小时前

你的 Mac 多了一个“AI 数字打工人”，Claude 测试接管电脑操作

AI 助手正在从“只会对话”向“深度代劳”完成质变。

3月24日，据报道，人工智能初创公司 Anthropic 正式发布了其备受瞩目的 “电脑使用”（Computer Use） 功能预览版。该功能允许 Claude 绕过传统的文本框限制，直接以“数字员工”的身份接管并操作用户的 Mac 电脑。

打破次元壁:AI 像人类一样移动鼠标

根据官方演示，借助 Claude Cowork 与 Claude Code 两款应用，Claude 展现出了跨越虚拟界限的执行力:

自主导航: AI 能够识别桌面元素，像真实用户一样移动指针、点击图标、在不同软件间自由切换。

流程自动化: 无论是打开并编辑本地文档、自动填写复杂的电子表格，还是在专业软件中处理繁琐的流转任务，Claude 都能独立规划并完成。

远程遥控: 配合配套的 Dispatch 功能，用户即便出门在外，也可以通过手机发送语音或文本指令，遥控办公室里的电脑完成工作。

付费用户专享:高门槛下的“研究预览”

目前，这项功能仍处于早期测试阶段，并设立了相对严格的使用门槛:

系统限制: 首发版本以“研究预览版”的形式独家登陆 macOS 系统。

人群定向: 仅面向付费订阅了 Claude Pro 和 Claude Max 的高级用户开放测试。

大模型下半场:从“对话框”走向“操作系统”

Anthropic 此举标志着大语言模型正加速向“AI Agent（智能体）”进化。过去，用户需要把数据“喂”给 AI;现在，AI 可以直接走进用户的桌面环境，深度介入实际的工作流。

尽管“电脑使用”功能目前仍带有实验性质，但它勾勒出的未来图景已十分清晰:未来的电脑操作可能不再需要频繁的点击与拖拽，用户只需下达意图，剩下的繁杂过程将由这位“数字打工人”全权负责。当 AI 真正握住鼠标的那一刻，人机交互的效率天花板正在被重新定义。

via AI新闻资讯 (author: AI Base)

21 小时前

英伟达通过大规模投资巩固 AI 霸权，被指利用资金优势捆绑客户

英伟达正利用其在全球 AI 热潮中积累的巨额现金储备，通过投资和信贷支持成为行业最具影响力的金融力量。自 2022 年以来，英伟达向 OpenAI、CoreWeave 及 Reflection 等初创公司投入了数十亿美元。这种“供应商、投资者兼债权人”的多重身份，不仅为面临高昂算力成本的公司提供了关键资金，也实际上将客户锁定在其生态系统中，使其难以转向 AMD 等竞争对手。

此外，英伟达还通过高价收购和灵活的交易结构规避监管审查，以获取核心技术与人才。例如，该公司斥资 200 亿美元与芯片初创公司 Groq 达成授权协议，并挖走其核心团队。针对此类行为，美国民主党参议员已致函要求英伟达说明情况，担忧其交易结构旨在逃避反垄断审查并扼杀市场竞争。

The Wall Street Journal

🌸 在花频道｜茶馆讨论｜投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel

21 小时前

ChatGPT 变身“云网盘”：付费用户迎来 Library 功能，文档图片跨对话调用

在 AI 助手的进化史上，如何让 AI “记住”并随时调用用户上传的资料一直是个痛点。近日，OpenAI 正式打破了对话框的限制，为 ChatGPT 付费用户推出了名为 “Library”（库） 的全新功能。这意味着 ChatGPT 不再只是一个即时聊天工具，而是进化成了一个具备深度存储与管理能力的“智能云盘”。

打破对话壁垒:文件自动存档与跨对话调用

以往用户上传的文件往往被“锁”在特定的某个对话中，一旦开启新对话就得重新上传。Library 功能彻底改写了这一逻辑:

● 自动保存: 用户在对话中上传的文档、电子表格、演示文稿以及图片，都会被系统自动保存到 Library 空间。
● 随时调取: 无论用户开启多少个新对话，只需点击输入框旁的附件按钮，选择“从 Library 添加”，即可瞬间调取历史文件，极大地提升了多任务处理效率。
● 双轨管理: 为了保持条理，用户自行上传的文件存放在 Library 区域，而由 ChatGPT 生成的 AI 图片则归类在独立的“Images”选项卡中。

隐私与权限:付费用户的专属“数字保险箱”

目前该功能主要面向 Plus、Pro 以及 Business 付费用户开放。在隐私处理上，OpenAI 采取了较为严谨的策略:

● 独立存储: 删除某个对话并不会同步删除 Library 中的文件，确保了资料的安全性。
● 彻底清除: 用户手动删除 Library 文件后，OpenAI 会在30天内从服务器彻底抹除数据。虽然这30天的缓冲期引发了合规性猜想，但对于需要频繁处理敏感文档的企业用户来说，这种明确的删除机制提供了必要的心理安全感。

Library 功能的上线，标志着 ChatGPT 正在从一个简单的“问答助手”转型为全功能的“个人 AI 工作站”。通过建立云端文件中心，OpenAI 实际上是在强化用户的使用粘性——当你的核心文档和历史素材都存储在 Library 中时，ChatGPT 就不再是一个可有可无的插件，而是成为了你数字生产力中不可或缺的底层系统。

via AI新闻资讯 (author: AI Base)

21 小时前

扎克伯格的“人才拼图”：收编 AI 智能体新星 Dreamer，老将重返 Meta

在 AI 智能体（Agent）赛道愈发拥挤的 2026 年，Meta 再次展现了其通过“收编人才”跨越技术周期的野心。据最新消息，Meta 已正式将初创公司 Dreamer 的创始团队收归麾下。这家成立于今年早期的公司，核心业务是降低 AI 智能体的开发门槛，让普通用户也能轻松创建个性化的数字助理。

老将回归：雨果·巴拉的“三进宫”

此次收购最受关注的焦点在于 Dreamer 的联合创始人——前小米全球副总裁雨果·巴拉（Hugo Barra）。这位曾先后效力于谷歌 Android 团队、小米以及 Meta VR 部门（2021 年离职）的传奇人物，时隔五年后正式回归 Meta。他将加入由 Meta 首席 AI 官汪滔（Alexandr Wang）领导的“超级智能实验室”，负责 AI 智能体及相关前沿项目的研发。

Dreamer 团队：全明星阵容的加盟

除了雨果·巴拉，Dreamer 的管理层名单堪称豪华：联合创始人包括前 Stripe 首席技术官、谷歌 Android 工程副总裁戴维·辛格尔顿（David Singleton）。

● 愿景对齐： 辛格尔顿透露，他在今年早些时候向扎克伯格展示产品后，双方迅速在“让数十亿人创造提升生活的软件”这一愿景上达成共识。
● 交易细节： 尽管具体金额保密，但知情人士称投资方获得了丰厚回报。Dreamer 将保留独立法人地位，并允许 Meta 获得其相关技术的非排他性许可。

Meta 对 Dreamer 的收编，标志着扎克伯格的战略重心已彻底转向 AI 驱动的生态构建。通过引入擅长处理大规模用户产品（如 Android、Stripe）的顶尖人才，Meta 意图在即将到来的“全民 Agent 时代”占据先机。雨果·巴拉在消费级硬件和全球市场运营方面的经验，或将助力 Meta 将 AI 智能体从实验室推向全球数十亿社交用户的手中。

via AI新闻资讯 (author: AI Base)

21 小时前

阿里达摩院发布玄铁C950：单核性能突破 70 分，刷新全球RISC-V纪录

在今日举行的2026玄铁 RISC-V 生态大会上，阿里达摩院正式发布新一代旗舰处理器玄铁C950。作为历时两年研发的重量级产品，玄铁C950凭借单核性能首次超过70分（SPECint2006）的成绩，刷新了全球 RISC-V CPU 的性能纪录。

技术规格显示，玄铁C950采用5nm 工艺，主频达3.2GHz。相较于前代 C920，其综合性能提升逾3倍，访存带宽增幅超4倍。在安全性方面，该处理器原生支持机密计算安全隔离与数据保护，并全面兼容 RISC-V 的强制及可选扩展指令集。

针对生成式 AI 浪潮，玄铁C950在硬件层面集成了自研 AI 加速引擎，成为全球首款原生支持 Qwen3、DeepSeek V3等千亿参数大模型的 RISC-V 处理器。这一突破显著增强了其在云计算、高端机器人及边缘计算等高算力场景中的竞争力。

玄铁C950的发布标志着 RISC-V 架构在高性能计算领域已具备挑战传统闭源架构的实力。通过深度融合 AI 推理能力与开源生态，该产品有望成为 AI Agent 时代的关键基础设施，进一步加速 RISC-V 在全球高端芯片市场的渗透与应用。

via AI新闻资讯 (author: AI Base)

21 小时前

算力的终局是能源：OpenAI 豪赌核聚变，欲锁定 5000 万千瓦“无限电力”

在 AI 领域，算力的尽头往往被认为是能源。为了支撑其庞大的基础设施野心，OpenAI 正与核聚变初创公司 Helion Energy 展开一场史诗级的能源博弈。据最新披露，双方正洽谈一项跨越十年的电力采购协议：OpenAI 计划在 2030 年前获取 5 吉瓦（500 万千瓦）电力，并最终在 2035 年将规模扩大至惊人的 50 吉瓦。

核聚变：AI 漫长征途的“圣杯”

训练大模型和维持推理服务是名副其实的“吞电兽”。目前，仅运行 ChatGPT 每天消耗的电量就相当于 3.3 万个美国家庭的用电总和。随着模型规模向万亿参数迈进，传统电网已难以承载这种指数级增长的负荷。

核聚变技术因其模拟太阳能量产生的原理，被视为提供无限清洁能源的终极方案。Helion 公司声称已接近实现“科学盈亏平衡”，即产出能量超过消耗能量。尽管这一目标在私营领域尚未有先例，但 OpenAI 的入局无疑为这项“硬科技”注入了最强效的助燃剂。

巨头入场与利益制衡

这场能源竞赛的背后，是科技巨头对未来算力霸权的提前卡位。除了 OpenAI，微软和 Google 也在积极布局核聚变领域，试图在全球能源转型中占据主动。

值得关注的是，OpenAI 首席执行官 Sam Altman 曾是 Helion 的领投人。为了规避外界对其“左手倒右手”的利益冲突质疑，Altman 已辞去 Helion 董事会主席职务并回避了相关谈判。这种从模型研发延伸至底层能源供应的垂直整合，揭示了 AI 产业的一个残酷真相：未来的竞争不仅是算法的较量，更是对物理世界基础资源（电力与芯片）的极致掌控。

via AI新闻资讯 (author: AI Base)

21 小时前

Plaud 中国区 CEO 莫子皓离职：AI 硬件赛道再现重量级“连续创业者”

在全球 AI 硬件市场高歌猛进的窗口期，明星初创公司 Plaud 迎来核心高管变动。

3月24日，据报道，Plaud AI 产研负责人兼中国区 CEO 莫子皓 已于近期正式离职。知情人士透露，这位有着深厚大模型背景与硬件经验的舵手，下一步或将投身 AI 硬件领域的自主创业。

从“公益达人”到“AI 捕手”:莫子皓的跨界履历

莫子皓的职业生涯充满了“效率”与“智能化”的底色。

学术背景: 本科毕业于中山大学管理学院，后获得北大光华管理学院金融硕士学位。

早期创业: 大学期间创办了国内首个网络公益平台“米公益”，通过趣味化交互解决公益项目痛点，是当年的标志性创业案例。

硬核进阶: 在加入 Plaud 前，他曾任暖哇科技合伙人兼 CPO，探索销售代理（Sales Agent）的自动化;随后加入“AI 六小龙”之一的百川智能，负责医疗大模型的落地应用。

Plaud 的中国征途:挑战与机遇并存

2025年5月，莫子皓正式加盟 Plaud。彼时，Plaud 已在海外市场大获成功，累计销量突破百万台，ARR（年度经常性收入）高达2.5亿美元。

在职期间，莫子皓全面负责全球市场的大模型产研、中国区团队组建及用户增长。尽管 Plaud 在2025年9月正式杀回中国内地市场，但国内 AI 录音笔赛道已成红海，钉钉、出门问问、安克等巨头纷纷下场。如何在“AI 纪要”的工具属性之上构建更深的护城河，成为留给 Plaud 中国团队的后续考题。

AI 硬件爆发前夜，新一轮“离职创业潮”开启

莫子皓的离职并非孤例，它折射出当前 AI 硬件/Agent 赛道正处于爆发前夜。

凭借在 Plaud 积累的硬件实战经验，以及在百川智能沉淀的大模型垂直落地背景，莫子皓的新项目极有可能瞄准“工作流智能化”的 AI 硬件工具。

当大模型走下云端、装进硬件，新一代“能听、会看、能办事”的智能终端正加速涌现。莫子皓的下场创业，无疑为2026年的 AI 硬件赛道增添了更多变数。

via AI新闻资讯 (author: AI Base)

21 小时前

CapCut推出用于AI视频生成的“Dreamina Seedance 2.0”模型

字节跳动旗下视频编辑应用 CapCut 正式上线 Dreamina Seedance2.0。该模型已在 CapCut 移动应用、桌面端和网页端同步可用，目前率先在印度尼西亚、菲律宾、泰国、越南、马来西亚、巴西和墨西哥逐步推出，并将随时间推移向更多地区扩展。

Dreamina Seedance2.0旨在通过 CapCut 解锁视觉叙事新可能，支持在单一流畅工作流中实现行业领先的视频生成与编辑。其核心亮点包括:

● 最高级别长视频连贯性:支持长达15秒的多镜头叙事，具备卓越的文本提示同步能力;
● 内置对话、唇形同步与沉浸式空间音效:让视频更具真实感和沉浸感;
● 多模态参考功能:提供更强大的创作控制和精准制作体验。

用户可在以下 CapCut 功能中体验 Dreamina Seedance2.0:

● 快速试用:AI 实验室和 AI 生成器（移动应用版本17.1.0）;
● 生成 + 编辑工作流:媒体 → AI 视频（移动应用及桌面端）;
● AI 原生工作流:视频工作室（全新基于画布的 AI 制作空间，适合从初学者到专业人士，通过 CapCut 网页端访问，支持全方位参考）。

此次更新标志着 CapCut 在 AI 视频工具领域的又一重要进步，用户可借助强大多模态控制，轻松创作更连贯、更有故事性的短视频内容。更多地区开放敬请期待。

via AI新闻资讯 (author: AI Base)

21 小时前

口腔诊疗再升级！青岛市口腔医院 AI 智慧服务号正式上线

随着人工智能技术在医疗领域的加速渗透，传统的口腔就医流程正在迎来一场“智慧化”变革。

近日，青岛市口腔医院 依托微信服务号平台，正式上线了深度融合本地化口腔 AI 智慧服务大模型的 “口腔 AI 智慧服务号”。这一举措标志着该院在智慧医疗领域迈入了全周期、全场景覆盖的新阶段。

三大核心 AI 应用，打造“口袋里的口腔医生”

此次上线的服务号集成了三项基于大模型能力的核心应用，旨在解决患者在就医前、中、后的各类痛点：

AI 智能客服： 提供 24 小时在线咨询，精准回答各类口腔健康与院务问题。

AI 智能导诊： 根据患者描述的症状，推荐最匹配的科室与专家，减少挂错号、走错路的麻烦。

AI 智能预问诊： 在患者到院前提前收集病情信息，帮助医生在接诊前快速掌握患者状况，提升诊疗效率。

全周期覆盖，优化就医“第一公里”

除了 AI 智能交互，青岛市口腔医院 还对原有的基础服务功能进行了全面升级。新系统整合了多场景的便民功能，实现了从预约挂号、诊间支付到检查报告查询的全流程覆盖。

助力智慧城市建设，科技赋能健康

作为青岛智慧医疗城市建设的重要组成部分，该 AI 智慧服务号的上线不仅提升了患者的就医体验，也为医院的精细化管理提供了数据支撑。未来，医院将继续深耕人工智能技术，持续优化 AI 模型在口腔专科场景下的表现。

via AI新闻资讯 (author: AI Base)

21 小时前

论文查重又升级！多所高校发文：严禁 AI 生成核心观点，违规或影响学位

随着生成式 AI 的深度普及，学术界对于“AI 助攻”的边界正在迅速收紧。

近日，包括 青岛科技大学、江苏大学 医学院、河北环境工程学院 在内的多所高校相继发布通知，正式规范研究生及本科生在学位论文中使用 AI 工具的范围。这标志着高校对学术论文的原创性审查已从单纯的“查重”演变为针对 AI 生成内容的“精准合规”。

红线明确:核心观点必须“人脑原创”

虽然各大高校并未全面封杀 AI，但对于论文的“灵魂”部分划定了严格的禁区。根据 青岛科技大学 研究生处发布的通知，AI 工具的使用必须坚持“人工主导、AI 辅助”原则。以下内容被明确严禁由 AI 生成:

核心命脉: 论文的核心观点、研究结论。

技术路径: 研究方法、研究方案设计。

原始数据: 严禁使用 AI 生成或改动原始数据及原创性结果图片。

分级管理:哪些环节允许“AI 辅助”?

在收紧核心环节管理的同时，部分高校也为 AI 留出了合理的辅助空间。河北环境工程学院 教务处在发文中提到，学生可以在以下范围内合规使用 AI:

前期准备: 文献检索与资料收集。

视觉辅助: 论文相关图表的辅助制作。

语言润色: 辅助文字排版与语法修正（需符合各校具体规范）。

学术诚信新常态:透明性与可控性

江苏大学 医学院在通知中强调，使用 AI 工具应遵循“辅助性、透明性、可控性”原则。这意味着未来学生在提交论文时，可能需要主动声明 AI 的使用范围，以确保研究过程的真实可靠。

随着大模型检测技术的不断升级，高校对“机写论文”的过滤手段也在同步更新。对于广大毕业生而言，AI 可以是高效的“数字秘书”，但在涉及创新性思维和科学实验数据的核心地带，独立思考与导师指导依然是确保顺利拿到学位的唯一路径。

via AI新闻资讯 (author: AI Base)

21 小时前

美团龙猫发布开源数学定理证明模型 LongCat-Flash-Prover

2026年3月24日，美团龙猫（LongCat）团队正式开源专门用于数学形式化与定理证明的深度学习模型——LongCat-Flash-Prover。该模型针对大语言模型在严密逻辑推演中的短板，通过将形式化推理拆解为自动形式化（Auto-Formalization）、草稿生成(Sketching)与证明生成(Proving)三大原子能力，实现了从“概率预测答案”向“严谨逻辑证明”的范式转变。

在结合工具集成推理（TIR）策略下，该模型在 MiniF2F-Test 基准测试中仅需72次推理预算即可达到97.1% 的通过率，刷新了开源 Prover 模型的 SOTA 纪录。此外，在 MathOlympiad-Bench 与 PutnamBench 等高难度竞赛级任务中，其表现亦全面超越现有开源模型。

技术层面，LongCat-Flash-Prover 采用了基于 TIR 的“混合专家迭代”框架。通过集成 Lean4Server 校验、语义及定理一致性检测以及针对9种作弊行为的合法性验证，模型有效解决了逻辑漏洞与代码欺骗问题。在训练阶段，团队引入分层 Masking 策略与 Token 层面 Staleness 控制，显著提升了 MoE 架构下强化学习的稳定性。

随着 AI 推理能力从自然语言模糊处理转向计算机可验证的形式化语言，此类 Prover 模型正逐渐超越算法跑分范式，转化为基础科学研究的“底座设施”。这一突破预示着 AI 深度参与前沿数学探索与文献自动化验证的时代正在加速到来。

● GitHub:https://github.com/meituan-longcat/LongCat-Flash-Prover
● Hugging Face: https://huggingface.co/meituan-longcat/LongCat-Flash-Prover
● Report:https://github.com/meituan-longcat/LongCat-Flash-Prover/blob/main/LongCat_Flash_Prover_Technical_Report.pdf

via AI新闻资讯 (author: AI Base)

21 小时前

扎克伯格再出手！Meta 收编 AI 创业公司 Dreamer，前小米副总裁雨果·巴拉重磅回归

硅谷的 AI 人才争夺战再次升级，这一次 Meta 将目光投向了由“老熟人”创办的初创团队。

北京时间 3 月 24 日，据 凤凰网 报道，Meta 已正式收购 AI 智能体创业公司 Dreamer。虽然具体协议条款尚未披露，但知情人士透露，Dreamer 的投资方将获得高于投资额的丰厚回报。此次收购的核心不仅在于技术，更在于 Dreamer 背后极具传奇色彩的创始团队。

“巴西虎”回归：雨果·巴拉重返 Meta 核心层

此次收购中最受关注的焦点莫过于 Dreamer 联合创始人 雨果·巴拉（Hugo Barra）。

辉煌战绩： 曾任 Google 安卓团队产品副总裁，后加盟小米担任全球副总裁，是小米国际化道路上的关键推手。

二度结缘： 2017 年至 2021 年期间，巴拉曾在 Meta（原 Facebook）负责 Oculus 及虚拟现实业务。

回归使命： 在 2021 年离职创业后，此次他随团队正式回归，将加入 Meta 超级智能实验室，负责 AI 智能体及相关前沿项目的研发。

收编 Dreamer：补齐 AI 智能体生态拼图

Dreamer 虽然成立于今年早些时候，但其技术路径与 Meta 的长期战略高度契合：

核心业务： 旨在帮助用户轻松创建个性化的 AI 智能体，降低 AI 应用的开发门槛。

合作模式： 交易完成后，Dreamer 仍将保留独立法人实体，而 Meta 则获得了该公司的非排他性技术使用许可。

人才整合： 整个 Dreamer 团队将整体并入 Meta 的超级智能实验室，为社交帝国的 AI 转型注入新鲜血液。

巨头围猎智能体，Meta 开启“人才防御战”

在 OpenAI、Google 及各路初创公司围攻 AI Agent（智能体）赛道的当下，扎克伯格通过“连人带公司”一起收编的方式，展现了其在 AI 领域志在必得的决心。

通过召回雨果·巴拉这样具备全球化视野和产品能力的顶级高管，Meta 不仅在技术层面上完成了对 Dreamer 智能体工具的整合，更在战略层面上强化了其大模型生态的落地能力。随着“前小米老将”的回归，Meta 的 AI 智能体项目或将迎来爆发式进展。

via AI新闻资讯 (author: AI Base)

21 小时前

谷歌 Gemini 开启“代打”模式：手机终于能自动点外卖了

AI 助手正在从“只会动嘴”向“替你动手”完成跨越。

近日，谷歌正式在 Pixel10Pro 和 Galaxy S26Ultra 上推出了 Gemini 的任务自动化功能（Task Automation）。这标志着 AI 助手正式从“对话工具”进化为“执行代理(Agent)”，不仅能回答问题，还能直接接管手机屏幕替你办事。

实测体验:全程“无人驾驶”，但需要点耐心

在 OSCHINA 披露的实测案例中，如果你想点一份 DoorDash 外卖，只需对 Gemini 下达自然语言指令，接下来的操作堪称“科幻”:

后台代操: AI 会自动打开应用、识别界面元素、填写表单并选择选项，最后确认订单。

异步运行: 执行过程中，屏幕底部会实时滚动“正在选择目的地”等进度。最酷的是，你可以切换去刷视频或回邮件，AI 会在后台持续运行直至任务完成。

速度瓶颈: 目前的缺点是“慢”。由于 AI 需要逐帧识别界面并进行云端推理，手动操作只需2分钟的任务，AI 可能需要9分钟。

技术破局:打破“信息查询”的十年天花板

过去十年，从 Siri 到 Google Assistant，语音助手始终停留在定闹钟、查天气的浅层交互。Gemini 任务自动化的核心突破在于其具备了复杂的长链条任务规划能力，让“发令-等待结果”成为了可能。

生态局限:仍处于“概念产品”阶段

尽管前景诱人，但目前的自动化功能仍面临不少挑战:

适配范围窄: 目前仅支持 Uber、DoorDash 等流程高度标准化的应用。

容错率待提升: 界面识别错误或支付环节的安全限制，仍是阻碍其大规模普及的硬伤。

巨头暗战:2026开启“AI Agent”元年

随着 OpenAI 的 Operator 和苹果 Apple Intelligence 的相继发力，谷歌此次抢先在移动端切入，意在依托 Android 生态抢占高频生活场景。

虽然现阶段的 Gemini 任务自动化看起来还有些“笨拙”，但技术进步往往遵循指数曲线。当 AI 能够以人类的速度流畅操作任意 App 时，我们与手机的交互方式将被彻底改写。这场“虽慢但酷”的进化，正是通往通用人工智能（AGI）的关键一步。

via AI新闻资讯 (author: AI Base)

21 小时前

西湖大学发布“泰坦 o1”：全球首个机器人“通用小脑”诞生

机器人领域正迎来属于它的“ChatGPT 时刻”。

3 月 23 日，由 西湖大学 孵化的西湖机器人公司正式发布了名为 泰坦 o1 的人形机器人。这款产品最引人注目的并非其机甲感十足的外观，而是其内置的全球首个动作泛化大模型 —— “GAE 身外化身系统”。

毫秒级复刻：一人操控百台“赛博分身”

在发布会现场，泰坦 o1展现了令人惊叹的模仿能力。当工作人员做出摆手、踢球或转身等动作时，机器人能在毫秒级时间内实现精准同步。

动作泛化： 凭借 GAE 系统 这一“通用小脑”，机器人不再需要针对特定动作进行死板编程，而是具备了像人类一样的动作适应能力。

时空突破： 该系统支持远程同步操控，这意味着一名操作者可以同时指挥成百上千个位于不同地点的机器人，完成高难度的协同作业。

零门槛上手：从春晚舞台到高危现场

西湖机器人团队表示，这套系统的使用门槛极低，普通用户无需任何编程经验，仅需通过动捕设备或电脑即可实现“所想即所动”。

实战验证： 在今年安徽卫视春晚上，10 台机器人仅用数天调试便完成了复杂的“五禽戏”群控表演，充分证明了其部署的高效性。

使命升级： “分身体验”只是第一步。未来，泰坦 o1将被派往消防救援、矿区作业、高空维护等高风险场景，成为人类探索危险地带的“钢铁替身”。

技术领跑：自研算法领先国际同行 6 个月

据 西湖大学 王东林教授介绍，这套完全自研的算法在动作泛化与跨本体适配能力上，比国际同类技术领先了至少 6 个月。正如大语言模型赋予了 AI 交流的能力，GAE 系统则为机器人补齐了“运动”这块最难的拼图。

随着 泰坦 o1 的发布，人形机器人正在从“好看但笨拙”的玩具，进化为真正能理解并复刻人类行为的生产力工具。在“通用小脑”的加持下，机器人走进现实生活的步伐正以前所未有的速度加快。

via AI新闻资讯 (author: AI Base)

1 天前

ChatGPT 新增文件库入口，已向 Plus、Pro 和 Business 用户推出

ChatGPT 优化了用户上传和创建文件的查找、复用与继续编辑流程，用户现在可以在对话中通过工具栏的最近文件快速引用文件，直接就已上传内容向 ChatGPT 提问，并在网页版侧边栏新增的 Library 标签中浏览文件。

这项功能正向全球的 Plus、Pro 和 Business 用户推出，欧洲经济区、瑞士和英国用户将于稍后获得。

OpenAI

🌸 在花频道｜茶馆讨论｜投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel

1 天前

Luma AI 发布 Uni-1 图像模型，采用自回归架构同步生成文本与像素

via AI新闻资讯 (author: AI Base)

Telegraph

Luma AI 发布 Uni-1 图像模型，采用自回归架构同步生成文本与像素

Luma Labs 于 3 月 23 日发布图像生成模型 Uni-1，这是该公司基于 Unified Intelligence 架构推出的首款公开模型。官网已开放免费试用，API 定价同步公布，企业接入通道将逐步上线。架构变化：从扩散模型到自回归 Uni-1 放弃了当前主流的扩散模型路线，转而使用 decoder-only 自回归 Transformer，将文本 token 与图像 token 交错排列成单一序列，在同一个前向传播中完成推理和像素生成。 Luma CEO Amit Jain 解释，传统…

1 天前

OpenAI 拟收购核聚变公司 Helion Energy，奥特曼辞去董事职务以避嫌

据 Axios 报道，OpenAI 正与核聚变初创公司 Helion Energy 进行“深入洽谈”，计划通过收购或其他深度整合方式布局聚变能源领域。为配合这一潜在交易并避免利益冲突，OpenAI 首席执行官萨姆·奥特曼（Sam Altman）已宣布将卸任 Helion Energy 的董事会职务。

随着大模型规模与算力需求的指数级增长，电力供应已成为制约 AI 发展的核心瓶颈。作为长期被视为清洁能源“圣杯”的核聚变技术，尽管目前仍需克服重大的科学与工程挑战才能实现商业化，但 OpenAI 此次表现出的强烈收购意向，反映了顶级 AI 机构试图通过掌控底层能源供应链来确保算力可持续性的战略紧迫感。

作为该领域的领军企业，Helion Energy 此前已获得奥特曼个人的巨额投资，其技术路径旨在通过更紧凑的装置实现商用发电。尽管核聚变的大规模落地尚无明确时间表，但 OpenAI 的介入标志着 AI 产业竞争正从算法、芯片层级延伸至基础能源供给层。

此举若能成功落地，不仅将改写科技巨头与能源供应商的关系，更预示着未来超大规模算力中心可能向“能源-算力一体化”模式演进。这不仅是 OpenAI 对长期战略资源的超前锁定，也可能加速全球核聚变技术的资本投入与商业化探索进程。

via AI新闻资讯 (author: AI Base)

1 天前

AMD 提出 AI 时代新主张：你可能需要一台专门的“养龙虾”主机

随着 2025 年“智能体元年”的爆发，开源 AI 框架 OpenClaw（俗称“龙虾”）的普及让端侧 AI 算力需求空前高涨。针对这一趋势，AMD 近期提出了一个颠覆性的概念：“智能体主机”（Agent Computer）。AMD 认为，在 AI 时代，用户应当拥有两台电脑：一台用于传统的办公与生活，另一台则作为“赛博牛马”，专门负责 24 小时挂机运行各种 AI 智能体。

告别云端：本地“养虾”的经济学与安全性

AMD 指出，当前 AI 普及面临三大门槛：部署难、隐私泄露以及高昂的 Token 成本。尤其是像“龙虾”这类需要高频调用大模型的智能体，如果完全依赖云端，成本将近乎失控。

因此，本地化部署成为最终方案。为了“养好”一只具备基本素质的智能体，设备至少需要 10GB 显存；若要运行多个 AI 员工或加载私有知识库，显存需求将直奔 64GB 以上。相比于购买数块昂贵的独立显卡，AMD 推出的锐龙 AI Max 系列平台提供了一个高性能且低成本的“底座”：通过 128GB 的超大统一内存，可划分出高达 96GB 的专用显存，让普通用户也能以两万元出头的成本，拥有一台顶级 AI 工作站。

智能体主机：计算发展史的新里程碑

AMD 认为，智能体主机与传统 PC 的本质区别在于驱动方式。传统 PC 是“人机交互驱动”，需要人坐在屏幕前操作；而智能体主机是“AI 自主驱动”，它不需要键鼠和显示器，而是通过微信、Slack 等通讯软件随时随地接收任务并反馈结果。

目前，基于锐龙 AI Max+ 395 平台的解决方案已在财税、医疗、教育等 11 个行业落地。例如在医疗领域，本地化智能体可以集成专家知识库，协助医生完成诊疗建档；在教育行业，则能将海量论文转化为可交互的对话实体。这种“专机专用”的模式，正标志着我们从移动互联网时代正式迈向“智能体十年”。

via AI新闻资讯 (author: AI Base)

Before

After

Home