https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
腾讯发布 HY-Embodied-0.5具身模型,22项评测16项最佳刷新行业纪录

近日,腾讯 Robotics X 实验室联合腾讯混元团队正式推出专为具身智能打造的基础模型 HY-Embodied-0.5。此举旨在解决通用视觉语言模型(VLM)因缺乏精细三维空间感知与物理交互能力,难以落地物理世界的行业痛点,标志着大模型认知链路正实质性延伸至机器人控制领域。

该系列模型并非通用基座的简单微调,而是从架构到训练范式的彻底重构。团队同步推出两款主力模型:MoT-2B(总参4B,激活2B)主打端侧实时响应,MoE-32B(总参407B,激活32B)追求极致推理性能。

技术上,团队首创视觉与语言模态非共享参数的混合 Transformer(MoT)架构,配合原生分辨率视觉编码器 HY-ViT2.0与视觉潜在 Token 机制,有效避免了小模型在多模态训练中的灾难性遗忘。训练层面,依托超1亿条高质量具身专属数据,结合拒绝采样微调、强化学习与在线蒸馏等多阶段后训练策略,驱动模型思维链自主进化。

性能验证显示,MoT-2B 在涵盖感知、推理、规划的22项权威评测中斩获16项最佳,超越 Qwen3-VL-4B 及 RoboBrain2.5等同参数竞品;旗舰版 MoE-A32B 综合成绩亦能与 Gemini3.0Pro 等国际标杆抗衡。

实机测试中,搭载该基座的机器人在打包、堆叠等任务上表现优于主流基线模型。这一进展为具身智能从虚拟仿真走向物理实操提供了高性能的底层基座支撑。

via AI新闻资讯 (author: AI Base)

Invalid media: video
物理 AI 设备将迎来爆发:2035 年预计出货量达 1.45 亿台

近日,Counterpoint Research 发布了一项关于物理 AI 设备的预测报告,预计在 2025 年至 2035 年之间,全球的物理 AI 设备累计出货量将达到 1.45 亿台。其中,无人机将占据 5900 万台,机器人将有 4800 万台,自动驾驶汽车的出货量则预计为 3800 万台。

在报告中,Counterpoint 指出,人形机器人市场将成为物理 AI 领域增长最快的细分类别。预计到 2028 年,人形机器人的累计安装量将突破 10 万台,较 2025 年将增长 7 倍。这一预测表明,人形机器人在未来的应用前景广阔,或将在各个行业中发挥重要作用。

Counterpoint 研究副总裁 Peter Richardson 强调,自动驾驶汽车是当前物理 AI 发展的基础层,人与机器之间的技术相似性正促使这一领域的快速发展。尽管自动驾驶技术、计算能力和实时连接等因素推动了这一进步,但仍需关注其在实际应用中的价值驱动性。

无人机在物理 AI 领域的表现同样亮眼,正成为最早实现大规模部署的应用之一。其在物流、监控及企业应用场景中的快速普及,使得无人机的市场需求显著增加,预计将在未来几年内继续保持强劲增长。

划重点:

🔹 预计 2025 至 2035 年物理 AI 设备累计出货量将达 1.45 亿台。

🔹 人形机器人市场将在 2028 年达到 10 万台,增长幅度达 7 倍。

🔹 无人机成为物理 AI 领域最早大规模部署的应用,市场需求持续增长。


via AI新闻资讯 (author: AI Base)
AI 音乐进入“翻唱”时代!MiniMax 发布 Music 2.6:推出全新 Cover 功能与 Agent 技能

AI 音乐生成的交互边界再次被拓宽,创作者们现在拥有了更精准的“指挥棒”。

4 月 10 日,大模型公司 MiniMax 正式发布了新一代音乐生成模型 Music 2.6。此次更新并非简单的版本迭代,而是从底层引擎到前端创作工具的一次全维度进化。

核心升级:更聪明、更顺滑、更好听

Music 2.6在技术底层进行了大幅优化,重点解决了 AI 音乐在生成过程中的痛点:

● 延迟骤降: 优化了生成逻辑,大幅缩短了用户从输入指令到听到旋律的等待时间。
● 精准控制: 增强了模型对节奏、风格及情感的控制精度,使生成的音乐更符合创作者的预期。
● 声学质感: 提升了声学品质,音频更细腻、更具空间感,进一步拉近了与专业录音室作品的距离。

创新功能:上线“Cover”与 AI Agent 技能

本次发布最大的亮点在于引入了两项全新的交互功能,旨在打破 AI 音乐生成的“黑盒”状态:

● 全新“Cover”创作: 允许用户利用模型对现有曲目进行“翻唱”或重塑,极大地释放了音乐二次创作的潜力。
● Music Skill(音乐技能): 面向 AI Agent(智能体)生态,该技能让 Agent 具备了原生调用音乐创作能力的可能性,进一步丰富了智能体在泛娱乐场景的应用。

创作者福利:全球免费内测开启

为了让技术快速回馈社区,MiniMax同步启动了大规模的体验活动:

● 14 天免费体验: 即日起,Music 2.6 向全球创作者开启为期两周的免费内测。
● 生态共建: 通过内测收集真实反馈,旨在进一步优化 AI 在音乐创作场景中的实战表现。

结语:从“随机生成”到“意图创作”

当MiniMax Music 2.6引入了更多可控性与 Cover 功能,AI 音乐正从一个充满随机性的趣味工具,进化为具备工业级潜力的创作伙伴

via AI新闻资讯 (author: AI Base)
字节跳动Seed团队核心人才流失:一年内70人离职,腾讯阿里成主要去向

据界面消息,字节跳动旗下AI核心部门Seed团队正面临剧烈的人才流动,过去一年间已有近70名技术人才离职并流入头部大厂及AI初创公司。这一变动折射出国内大模型领域人才竞争已进入白热化阶段。

作为字节跳动AI研发的核心力量,成立于2023年的Seed团队研究方向覆盖LLM、语音、视觉及世界模型等前沿领域,其研发的豆包大模型已支撑起豆包、扣子(Coze)等50多个应用场景。

然而,过去一年该团队成为行业“挖角”的重点目标。其中,近30名成员加入腾讯,主要负责AI Infra和数据基建;顶级实习生葛浩则转投阿里通义千问(Qwen)团队,深度参与强化学习基建研发。

人才外溢不仅流向成熟大厂,更在创投市场形成了规模化的“字节系”创业潮。目前已有30余家由字节前员工创立的AI公司获得融资,业务涵盖Agent、多模态创作及具身智能等赛道。尽管字节跳动在2025年9月曾推出高额期权津贴——为大模型技术员每月发放价值最高达13.5万元的期权——以期留住核心人才,但依然难以阻挡人才在行业风口下的主动迁徙。

via AI新闻资讯 (author: AI Base)
五部门印发《“人工智能+教育”行动计划》,国家将开发全学段AI慕课资源

4月10日,教育部、国家发展改革委、工业和信息化部、科技部及国家数据局五部门联合印发《“人工智能+教育”行动计划》,正式宣布将由国家统一开发覆盖全学段的AI慕课资源,旨在构建全民AI素养培育机制,确保全体学习者享有平等获取人工智能教育的机会。

该计划标志着我国人工智能人才培养进入体系化推进阶段。在基础教育领域,AI课程将作为地方必修课开齐开足,侧重于智能思维启蒙与生活赋能;高等教育则将人工智能全面纳入公共基础课程体系,通过增设微专业及微证书提升学术竞争力;职业教育则聚焦传统产业的智能转型,致力培养适配产业变革的高技能人才。此外,国家智慧教育平台将上线针对全民的免费AI通识课,集成智能导学、个性化路径规划及AI伴学等前沿技术,通过数字化手段填补城乡教育资源鸿沟。

从行业视角看,此举不仅是教育模式的升级,更是国家层面对人工智能生产力属性的深度锚定。通过提升全民数字素养与教师的智能教学动力,国家正试图从供给侧重塑劳动力结构。到2030年,随着全学段教育体系的建成,人工智能将彻底从精英工具转化为社会基础性技能,为我国在全球AI竞争中储备深厚的人才池与应用生态基础。

via AI新闻资讯 (author: AI Base)
iOS 26 重磅更新!短信应用引入 AI 智能搜索功能

苹果公司正式发布了 iOS 26 系统,并对短信应用进行了重大优化。这次更新不仅提升了群聊功能和垃圾信息防护,还将核心的搜索功能进行了全面升级,利用人工智能技术实现了质的飞跃。

许多 iPhone 用户在短信应用中存储了大量的历史对话、照片、链接等信息,甚至包括数年前的聊天记录,这些数据往往占据了大部分的 iCloud 存储空间。然而,以往的搜索功能往往依赖于精确的关键词,用户在查找信息时常常费时费力。

随着 iOS 26 的推出,短信搜索功能迎来了全新的变化。用户现在可以使用自然语言输入他们的搜索需求,比如输入 “六月份去海滩旅行时妈妈的照片”,系统能够准确识别其语义并匹配相应的结果。同时,用户输入关键词后,系统也会显示相关内容,例如输入 “沙子” 时,还会推荐关于海滩和海洋的相关短信。

这一升级的搜索功能是由苹果智能(Apple Intelligence)驱动的,依托于大型语言模型(LLMs),与照片、音乐等应用的 AI 搜索逻辑相一致。需要注意的是,此项功能仅支持部分机型,包括 iPhone 15 Pro 及以上系列、iPhone 16 全系列、iPhone 17 全系列及 iPad Air。用户在设备支持 Apple Intelligence 且已开启该功能的情况下,短信应用会自动适配这一升级,AI 搜索功能无需额外设置。

此次更新无疑为用户的使用体验带来了极大的提升,帮助他们更快速地找到所需的信息,也展示了苹果在智能化领域的持续进步。

划重点:

📱 iOS 26 系统对短信应用进行重大优化,引入 AI 智能搜索功能。

🧠 用户可通过自然语言输入进行搜索,提升信息查找效率。

📲 该功能支持特定机型,用户无需额外设置,自动适配升级。


via AI新闻资讯 (author: AI Base)
谷歌 Gemini AI 新增互动 3D 模型功能,提升科学学习体验

谷歌最近为其 Gemini AI 聊天机器人增添了交互式3D 模型和模拟功能。这项新功能旨在帮助用户在学习和研究科学概念时,通过动态可视化的方式加深理解,而不仅仅依赖传统的文本和静态图示。用户只需向 Gemini 发出相关指令,就可以生成可操作的三维内容和互动图表。

与以往主要展示文字和静态图表的回答相比,Gemini 如今能够提供 “可运行的模拟”,将复杂的主题以动态的形式呈现。用户可以利用这一功能来模拟复杂的物理系统,旋转分子结构,或以三维视角观察月球围绕地球运动的过程。例如,在模拟月球轨道时,用户可以通过手动滑块调节初速度和引力强度等参数,实时观察这些变量如何共同形成稳定轨道。

要使用这一新功能,谷歌建议用户在提问时使用 “展示给我” 或 “帮我可视化” 这样的表达方式,同时确保选择 “Pro” 模型以调用相关能力。例如,当用户输入 “可视化分形是如何运作的” 时,Gemini 会生成分形生长的动态图像,用户可以调整分支角度、长度比例和迭代次数,观察分形形态的变化。同样,在量子物理领域,用户可以通过 “给我演示双缝实验如何运作” 来探索双缝干涉的过程。Gemini 将提供一个交互界面,让用户修改波长、波速、缝距等参数,实时看到波形和干涉图样的变化,从而更直观地理解这些抽象的物理概念。

谷歌在其博客中指出,这项3D 模型和模拟功能正在逐步向所有用户开放,但教育版和 Workspace 账号的用户暂时无法使用。官方表示,这一功能是在 Gemini 先前学习和教学能力的基础上进行的扩展,旨在进一步提升其在教育和知识可视化方面的表现。此前,Gemini 已能够针对生物、物理、化学和数学等学科生成可点击的交互式示意图,帮助学生以图形方式探索复杂的学术主题。此次新增的3D 模型和动态模拟功能则在这一基础上提供了更高维度的可视化能力。

划重点:

🌐 Gemini AI 新增互动3D 模型和模拟功能,提升科学学习的可视化体验。

🔬 用户可通过调整参数,实时观察复杂物理系统和分子结构的动态变化。

📚 功能正在逐步向所有用户开放,教育版和 Workspace 用户暂不支持。


via AI新闻资讯 (author: AI Base)
微软开始在Windows 11应用中移除Copilot品牌 记事本AI功能已替换图标

早前微软发布博客宣布将改进 Windows 11 性能和用户体验,当时就有用户提出希望微软能够更谨慎地处理 Windows 11 中的人工智能功能和 Microsoft Copilot 相关的服务。

目前微软直接将 Copilot 默认安装在 Windows 11 中,而多项服务则调用 Copilot 提供的人工智能服务,例如记事本里用户可以使用 Copilot 改进文本、总结或者更改语气等。

但实际情况是很多用户并不喜欢 Copilot,这也迫使微软正在逐步将 Copilot 品牌标识从系统和应用里移除,最新的变化就是记事本里的 AI 功能已经不再使用 Copilot 品牌。

图片来源 @Phantomofearth

在最新推出的记事本更新里,微软将 AI 功能重命名为高级功能,原本的 Copilot 图标也会被删除,取而代之的是专门的写作工具图标,帮助用户更好地理解功能用途。

实际点击后高级功能包括的可用功能有重写文本、对内容进行总结摘要、更改内容语气等,功能方面与此前的 Copilot 品牌没有任何区别,而且实际调用的应该也还是 Copilot 相关 AI 服务。

目前在 Windows 11 预装应用或微软自家应用里使用 Copilot 品牌标识的还非常多,估计后续这些选项都会被陆续清理换成应用对应的功能,不再使用 Copilot 品牌。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:蓝点网)
美国佛罗里达州对OpenAI公司展开调查

美国佛罗里达州总检察长詹姆斯·乌斯迈耶正在对OpenAI公司展开调查,理由是公共安全和国家安全风险。在周四的声明中,乌斯迈耶表示,人们担心OpenAI的数据和技术正落入美国敌人的手中,例如中国共产党。乌斯迈耶还表示,OpenAI公司的ChatGPT已被用于犯罪行为,涉及儿童性虐待内容以及对自残的 “鼓励”。他补充说,ChatGPT可能已被用于 “协助” 涉嫌于2025年4月在佛罗里达州立大学实施枪击事件的人。本周,一名在佛罗里达州立大学枪击事件中遇难男子的家人对OpenAI公司提起诉讼,指控嫌疑人一直与ChatGPT聊天机器人“持续交流”。

—— Theverge

via 风向旗参考快讯 - Telegram Channel
Issue with API platform login and account creation

Status: Resolved

All impacted services have now fully recovered.

Affected components
Login (Operational)

via OpenAI status
ChatGPT推出新的每月100美元的Pro套餐

OpenAI公司宣布推出新版ChatGPT Pro订阅服务,每月费用100美元。新的Pro套餐提供了比每月20美元的Plus套餐多五倍的Codex编码工具使用量,并且最适合更长、高强度的Codex会话,OpenAI表示。该公司正在推出这个新套餐,因为其试图从Anthropic公司及其受欢迎的 Claude Code 工具那里赢得用户。根据 OpenAI的说法,ChatGPT Plus 套餐将继续以20美元的价格成为Codex日常稳定使用的最佳选择,而新的100美元Pro套餐为更高强度的日常使用提供了一个更易获得的升级路径。OpenAI公司还提供了每月八美元的Go套餐和一个免费套餐。

—— Theverge

via 风向旗参考快讯 - Telegram Channel
OpenAI备忘录曝光 算力优势成压制Anthropic底牌

4月10日,据彭博社报道,OpenAI本周对投资者表示,其早期大幅增加计算资源的举措,使其在与长期竞争对手Anthropic的竞争中占据了关键优势。目前,Anthropic的发展势头越来越猛,并考虑进行首次公开招股(IPO)。

OpenAI

在Anthropic发布了名为Mythos的更强大AI模型后,OpenAI向部分投资者发送备忘录称,称其通过“快速且持续地”增加算力来支持其软件的更广泛应用,从而领先了Anthropic。这份备忘录还指出,这一曾被一些人批评为成本过高的基础设施扩张,使OpenAI能够更好地跟上AI产品需求的不断增长。

“这种领先很重要,因为算力现在是产品发展一个制约因素。”OpenAI在备忘录中称。

近几个月来,Anthropic一度难以维持其服务稳定运行,原因是新产品推出以及该公司与五角大楼对峙所获得的公众支持导致需求激增。

OpenAI在发给投资者的备忘录中引用了分析师本·汤普森(Ben Thompson)的一份报告。该报告指出,算力的限制可能影响了Anthropic,使其决定将Mythos仅限向特定合作伙伴发布。

OpenAI表示,2025年其可用计算能力达到1.9吉瓦,是前一年的三倍。该公司预计,这一数字明年将增长至“较低的两位数范围”,到2030年将达到约30吉瓦。相比之下,OpenAI估计 Anthropic在2025年底拥有1.4吉瓦的算力,明年将达到7至8吉瓦。

“即便预测区间的上限计算,我们的算力增长也遥遥领先,而且优势还在扩大。”OpenAI在备忘录中表示。

作为回应,Anthropic让彭博社参考其CFO克里希纳·拉奥(Krishna Rao)此前就与博通和Google达成交易时发表的一份声明。拉奥当时表示:“与Google和博通达成的这一突破性合作伙伴关系,延续了我们一贯以来在扩展基础设施方面的审慎态度。我们正在做出迄今为止最大规模的算力投入承诺,以跟上这一前所未有的增长步伐。”

截至发稿,OpenAI不予置评。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:凤凰网科技)
Anthropic据悉考虑自研AI芯片

据多位消息人士透露,人工智能初创公司Anthropic正在探索自主设计芯片的可能性。该公司及其竞争对手正努力应对人工智能芯片短缺的问题,而这些芯片对于驱动和开发更先进的人工智能系统至关重要。

据两位知情人士和一位了解Anthropic计划的人士称,该计划尚处于早期阶段,该公司最终可能还是会选择购买人工智能芯片,而不是自行设计。其中一位消息人士表示,该公司尚未确定具体的设计方案,也没有组建专门的团队来负责该项目。

Anthropic本周早些时候表示,其人工智能模型Claude的需求在2026年加速增长,该公司今年的年化收入预计将超过300亿美元,高于2025年底的约90亿美元。

Anthropic使用多种芯片,包括Alphabet旗下谷歌设计的张量处理单元(TPU)和亚马逊的芯片,来开发和运行其人工智能软件和聊天机器人Claude。

本周早些时候,Anthropic 与谷歌和博通签署了一项长期协议,后者将协助设计谷歌的TPU。该协议建立在 Anthropic承诺投资 500 亿美元加强美国计算基础设施的基础上。

Anthropic 的谈判与 Meta 和 OpenAI 等大型科技公司正在进行的类似努力遥相呼应,这些公司都在寻求设计自己的 AI 芯片。

据业内人士透露,设计一款先进的人工智能芯片可能需要花费大约5亿美元,因为公司需要聘请技术娴熟的工程师,并投入资金以确保制造过程中没有缺陷。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
Issues with share link creation on web UI

Status: Investigating

We are investigating the issue for the listed services.

via OpenAI status
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]