ChatGPT / AI新闻聚合

https://api.oaibest.com - API中转2.8折起

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

8 小时前

DeepMind CEO 哈萨比斯警示：初创公司高估值助长 AI 泡沫

谷歌 DeepMind 联合创始人兼 CEO 德米斯・哈萨比斯近日在《Google DeepMind：The Podcast》节目中发出警告，指出当前 AI 创业环境中正在形成泡沫现象。他强调，许多早期初创公司在尚未真正展开业务的情况下，竟以数百亿美元的天价估值进行融资，这种现象并不具备可持续性。

哈萨比斯提到，与大型科技公司的融资模式应有所区别。后者在 AI 基础设施方面的巨额投资，背后有成熟的商业模式作为支撑。他表示，虽然短期内 AI 领域可能被高估，但从中长期来看，市场对于 AI 的真实影响力仍显不足。他认为，任何重大技术浪潮的兴起都伴随着一种由怀疑到狂热的快速转变，而这种转变往往会导致估值的过度波动。

回顾自己创立 DeepMind 的经历，哈萨比斯提到当时几乎无人相信其所代表的方向，但如今 AI 已成为商业界的核心话题。尽管现在的投资热潮显得异常火爆，但他对此并不感到困惑。近期，一些初创公司吸引了大量投资，许多年轻创业者更是直接从校园走向创业，其中不乏获得巨额融资的案例。

此外，橡树资本管理的霍华德・马克斯在其他节目中表示，市场上大量资金流向缺乏业绩记录的 AI 初创公司，让人不得不思考投资选择。他质疑投资者是否愿意将资金投向那些没有收入、没有利润的初创公司，还是选择已经有稳定盈利的成熟企业。

哈萨比斯的发言为投资者提供了一个清醒的视角，提醒大家在追逐 AI 热潮的同时，不应忽视市场的理性判断。

划重点：

🌐 哈萨比斯警示 AI 初创公司天价估值或形成泡沫，难以持续。

💼 大型科技公司的投资背后有成熟商业模式支撑，需区分对待。

🚀 市场对于 AI 的真实影响力可能被低估，创业者热潮仍在持续。

via AI新闻资讯 (author: AI Base)

8 小时前

OpenAI拟融资100亿美元牵手亚马逊，Trainium3芯片或成英伟达之外关键算力选项

OpenAI正与亚马逊展开一项可能重塑AI算力格局的深度合作。据《The Information》报道，OpenAI正在谈判从亚马逊获得至少 100 亿美元融资，并考虑在其训练基础设施中引入亚马逊自研AI芯片 Trainium，以实现算力供应链的多元化。

若交易落地，这将是亚马逊Trainium芯片迄今获得的最具分量的外部客户。作为AWS为打破英伟达垄断而自主研发的AI加速器，Trainium系列一直主要服务于亚马逊内部大模型训练。今年 6 月初，AWS刚刚发布Trainium3，性能实现跨越式升级：相比上一代，其计算性能最高提升4. 4 倍，能效提升 4 倍，内存带宽接近翻倍。

更关键的是，基于Trainium3 构建的 UltraServer 系统具备惊人扩展能力——单机柜可集成 144 枚芯片，整个集群可支持部署多达 100 万枚Trainium3，为单一AI应用提供空前规模的专用算力，整体系统规模达上一代的 10 倍。这种超大规模部署能力，恰好契合OpenAI等前沿AI公司对海量、稳定、低成本算力的迫切需求。

目前，OpenAI的训练集群高度依赖英伟达GPU，但随着模型规模指数级增长，算力成本与供应风险日益凸显。引入亚马逊芯片，不仅是技术备份，更是战略对冲——通过扶持第二供应商，OpenAI可增强议价能力、保障交付安全，并推动整个AI基础设施生态向多极化演进。

对亚马逊而言，这笔合作意义同样重大：若能将OpenAI纳入Trainium生态，不仅证明其芯片具备顶级AI训练能力，更可能吸引其他大模型公司跟进，加速其从“内部自用”走向“外部商业化”的关键转型。

在AI竞赛已进入“算力即国力”阶段的今天，OpenAI与亚马逊的潜在联盟，不只是两家公司的商业决策，更可能成为全球AI供应链去中心化的重要转折点——英伟达的护城河，正在被悄然拓宽的第二条战线所冲击。

via AI新闻资讯 (author: AI Base)

8 小时前

美的医疗发布国产医学影像大模型：胸部DR病种“一键诊断”，双量级架构兼顾端云部署

美的集团加速AI医疗布局。旗下美的医疗近日正式推出具备完全自主知识产权的“医学影像多模态智能诊断大模型”，标志着其在智慧医疗核心赛道实现关键突破。该模型目前已实现对肺结核、肺炎、气胸、骨折等常见胸部疾病的一次性自动检测，并能自动生成结构化诊断报告，大幅提升基层医疗机构的阅片效率与诊断一致性。

区别于多数依赖单一部署模式的AI影像系统，美的医疗旗下万里云研发团队创新采用“双量级”模型架构——即同时提供轻量化设备端模型与高精度云端模型。前者可嵌入DR设备本地运行，满足无网或弱网环境下的实时诊断需求;后者则依托云端算力处理复杂病例，支持高并发与持续学习。这种灵活部署策略显著增强了产品在不同层级医院的临床适应性。

目前，该模型聚焦胸部DR（数字化X光）影像，已在多家合作医院试运行。根据规划，2026年将扩展至骨科DR领域，支持各类骨折、关节病变的智能识别;中长期则将逐步覆盖CT、MRI等多模态影像，构建覆盖全身部位、多病种的智能诊断平台。

在AI医疗监管趋严、数据安全要求提升的背景下，美的医疗强调该模型从算法、训练数据到部署系统均实现国产化与自主可控，符合国家对医疗AI“安全、可信、可落地”的发展导向。此举不仅强化了美的在“智慧医疗+高端制造”融合战略中的技术壁垒，也为国产医学AI在基层医疗的规模化应用提供了新范式。

via AI新闻资讯 (author: AI Base)

8 小时前

💰OpenAI与亚马逊洽谈百亿美元融资，估值或超5000亿

OpenAI正与亚马逊进行初步谈判，寻求至少100亿美元的融资，并可能使用亚马逊的Trainium芯片。这项潜在交易可能使OpenAI的估值超过5000亿美元，同时也将大力推动亚马逊在半导体领域的发展。尽管英伟达目前主导AI芯片市场，但包括Meta和谷歌在内的其他开发者也在探索替代方案，这凸显了AI硬件市场日益激烈的竞争。目前谈判尚处于早期阶段，条款仍可能发生变化。

(财经快讯)

via 茶馆 - Telegram Channel

8 小时前

谷歌测试一款基于电子邮件的效率助手

当地时间周二，谷歌公司通过 Google Labs 实验推出一款名为CC的实验性基于电子邮件助手。CC由Gemini提供支持，可与您的账户连接，例如Gmail邮箱、Google云端硬盘和Google日历，并通过电子邮件向您提供每日简报。这封 “Your Day Ahead” 电子邮件让用户了解其任务，总结他们的日历，并提供来自这些账户的当日关键更新。您也可以随时回复或通过电子邮件向CC提出请求，例如添加待办事项、教它了解你的偏好、记住笔记或搜索信息。目前，CC可供美国及加拿大十八岁及以上的AI Pro和Ultra用户使用。

—— Techcrunch

via 风向旗参考快讯 - Telegram Channel

9 小时前

Zoom 声称在 AI 领域取得突破，业内反响两极化

近日，Zoom 视频通讯公司宣布，其人工智能系统在一项名为 “人类最后考试”（Humanity's Last Exam）的测试中取得了48.1% 的最高分，超越了谷歌的 Gemini3Pro，以45.8% 的成绩曾经创下的记录。这一消息引发了技术界的广泛关注和热议。

Zoom 的首席技术官黄学东在博客中指出，该公司并没有自行训练大型语言模型，而是采取了一种 “联合 AI” 的方法，结合了来自 OpenAI、谷歌和 Anthropic 的多个现有模型。Zoom 构建了一个被称为 “Z 评分器” 的系统，能够评估来自不同模型的回答并选择最佳的输出。该系统通过 “探索 - 验证 - 联合” 的策略，整合多种 AI 模型的能力。

然而，业内对此反应不一。一些 AI 专家批评 Zoom 的做法，认为其只是将 API 接口简单组合起来，并未进行真正的创新。比如，AI 工程师 Max Rumpf 就表示，Zoom 未经过模型训练，却仍然声称自己创造了 “最先进的技术”。他认为，这种做法掩盖了事实，损害了其他模型开发者的努力成果。

相对而言，部分评论者则认为 Zoom 的做法是行业内的最佳实践，类似于在 Kaggle 竞赛中通过集成模型来取得胜利。还有人指出，Zoom 的成就展示了未来企业 AI 的发展方向，即将多个模型的能力整合在一起，而不是单纯追求构建最强的单一模型。

Zoom 的这一策略不仅避免了因依赖某一模型而导致的风险，还能为用户提供最适合的 AI 解决方案。随着 Zoom 在 AI 领域的进一步发展，用户将通过使用其 AI Companion3.0的功能来检验其实际价值和效果。

划重点:

🌟 Zoom 在 “人类最后考试” 中取得了48.1% 的最高分，超越谷歌的记录。

🤖 该公司采用了 “联合 AI” 方法，通过整合多个现有模型来实现其 AI 能力。

💡 行业内对 Zoom 的做法意见分歧，部分专家批评其缺乏创新，而另一些人则认为这是行业最佳实践。

via AI新闻资讯 (author: AI Base)

9 小时前

微信输入法iOS版3. 0 重磅上线： 15 种方言全覆盖，语音输入无时长限制，离线也能用

微信输入法迎来里程碑式升级。今日，其iOS版本正式推送3.0.0大版本更新——版本号直接从2.2.6跃升至3.0，标志着产品重心全面转向语音优先的下一代交互体验。新版核心聚焦语音输入能力的彻底重构，不仅底层大模型全面升级，实现“更快、更准”的识别效果，更在实用性、语言覆盖与隐私保护上迈出关键一步。

此次更新最引人注目的是对15种中国方言的深度支持，包括粤语、四川话、河南话、陕西话、上海话、苏州话、无锡话、南昌话等，覆盖南北方言区主流口音。用户无需手动切换语言模式，系统可自动识别并准确转写，真正实现“说方言，出文字”的自然输入体验。

针对会议记录、课堂讲座、访谈等长时间语音场景，3.0版本彻底取消语音输入时长限制，支持连续数小时不间断转写，满足专业级记录需求。更关键的是，新版本新增离线语音识别能力——即便在网络信号弱或无网络环境下，用户仍可流畅使用语音输入，大幅提升使用场景的可靠性。

在隐私方面，微信输入法强调严格遵循“最小、必要”原则，所有语音数据处理均依据《微信输入法隐私政策》执行。官方明确表示，仅获取功能运行所必需的信息，不会额外采集或上传用户语音内容，尤其在离线模式下，数据完全本地处理，不触网、不留存。

此次3.0版本的发布，不仅是技术迭代，更是微信输入法从“打字工具”向“智能语音入口”转型的明确信号。在AI助手与语音交互日益成为移动生态核心入口的当下，微信正试图凭借其庞大的用户基础与对中文语境的深度理解，打造一个更自然、更私密、更包容的下一代输入体验——让每个人，无论说什么话，都能被准确“听见”。

via AI新闻资讯 (author: AI Base)

9 小时前

AI 科学研究新基准:FrontierScience 评估模型推理能力

在科学研究中，推理能力至关重要。科学家们不仅仅是回忆事实，还需提出假设、测试并修正这些假设，并在不同领域之间综合思想。随着 AI 模型能力的提升，如何评估它们在科学研究中深度推理的能力成为了一个重要问题。

最近，AI 模型在一些重大领域取得了里程碑式的成就，包括在国际数学奥林匹克和信息学奥林匹克比赛中表现优异。同时，GPT-5等先进模型正在有效加速真实的科学工作流程。研究人员利用这些系统进行跨学科的文献搜索以及复杂数学证明的工作，显著缩短了从几天或几周到几小时的研究时间。

为进一步评估 AI 在科学研究中的能力，我们推出了一个新基准 ——FrontierScience。这一基准专注于评估在物理、化学和生物等领域的专家级科学推理能力。FrontierScience 包含了数百个经过专家验证的难题，并设有两个问题追踪:奥林匹克版和研究版，旨在分别测量奥林匹克风格的科学推理能力和真实世界的科学研究能力。初步评估结果显示，GPT-5.2在 FrontierScience-Olympiad 和 Research 两个模块中的表现优于其他模型。

具体而言，GPT-5.2在奥林匹克模块中得分77%，在研究模块中得分25%。尽管目前的模型已经能够支持结构化推理的研究环节，但在开放式思维能力方面仍有待提升。当前，科学家们利用这些模型加速研究流程，但在问题框架和验证方面仍需依赖人类的判断。未来，我们将继续完善 FrontierScience 基准，并扩大其应用领域，以帮助模型成为科学发现中的可靠伙伴。

划重点:

🔍 FrontierScience 是一个新推出的基准，旨在评估 AI 在科学领域的推理能力。

📊 初步评估显示，GPT-5.2在科学推理能力上表现突出，但仍需提升开放式思维能力。

🚀 AI 模型的进步正在加速科学研究流程，未来将进一步优化评估基准与扩展应用领域。

via AI新闻资讯 (author: AI Base)

9 小时前

Meta 授权员工使用竞争对手 AI 工具，提升工作效率

近日，Meta 宣布将扩大员工对谷歌和 OpenAI 等竞争对手人工智能工具的使用权限，力求在公司的工作流程中更加广泛地融入人工智能技术。根据 Business Insider 的报道，Meta 已鼓励员工使用多种先进的 AI 工具，如 ChatGPT-5和 Gemini3Pro，以提升工作效率和创造更大价值。

Meta 首席信息官阿蒂什・班纳吉在一份内部备忘录中指出，公司的首要任务之一就是将人工智能融入日常工作中。他强调，人工智能应成为工作的核心，帮助员工更高效地完成任务。随着这一方针的推广，Meta 的员工已经能够使用一系列新的 AI 工具，包括由其自研的 Llama 系列模型。

在具体的工具列表中，员工可以使用 Agentic Auto 和 Advanced Auto 等高端智能体。这些工具设计用来处理更复杂的任务，并能根据员工的需求提供优化的解决方案。此外，Meta 还推出了名为 Metamate 的内部 AI 助手，以支持员工的日常工作。

Meta 此次开放竞争对手工具的使用权限，旨在促进创新和提高工作效率。除了技术上的更新，Meta 还通过趣味激励机制来鼓励员工灵活运用人工智能。在这方面，员工可以通过参与名为 “能力进阶” 的内部游戏获得徽章奖励，表现优秀的员工还将与绩效挂钩，得到额外奖励。

值得一提的是，Meta 还与人工智能初创公司 Midjourney 达成合作，将其图像生成技术整合到公司的产品中。此举旨在进一步加快设计和创意原型的开发。通过这些举措，Meta 希望能推动整体工作效率的提升，创造更加智能的办公环境。

划重点:

🔍 Meta 扩大员工使用竞争对手 AI 工具的权限，推动 “人工智能优先” 的办公环境。

💡 员工可使用多种新工具，包括 ChatGPT-5和 Gemini3Pro，帮助提升工作效率。

🏆 通过趣味激励机制，鼓励员工灵活运用人工智能，并将其应用效果与绩效挂钩。

via AI新闻资讯 (author: AI Base)

9 小时前

教育部发文:中小学考试将迎 AI 时代，命题、阅卷、分析全流程试点人工智能

教育部近日印发《关于进一步加强中小学日常考试管理的通知》，明确提出将利用尖端技术赋能教育评价。国家将试点探索人工智能在日常考试命题、组卷、阅卷及分析等关键环节的深度应用。

根据教育部新闻办“微言教育”发布的消息，此次《通知》旨在全方位提升中小学考试管理的专业性与科学性。各地教育行政部门将统筹推进命题审题团队建设，通过开发命题指导手册和结构化培训资源，系统指导教师进行科学命题、精准考试分析及多元评价。

值得关注的是，教育部强调要依托国家中小学智慧教育平台，采取线上线下相结合的方式扩大培训覆盖面，并重点提到将试点探索人工智能在命题、组卷、阅卷、分析等关键业务场景的应用，力求通过 AI 技术实现评价的客观化与智能化。这一举措标志着人工智能正式从辅助学习向教育核心评价环节延伸，有望大幅减轻教师负担并提升教学质量分析的精准度。

via AI新闻资讯 (author: AI Base)

9 小时前

爱诗科技与阿里云签署全面合作协议推动 AI 视频全球化发展

爱诗科技与阿里云在北京阿里朝阳科技园正式签署了全面合作协议。此次合作将围绕全栈 AI 能力及全球化布局展开，双方将在模型、算力、产品、生态和商业等多个层面进行深度协同，旨在共同推动 AI 视频生成领域的发展。

签约仪式上，阿里云智能集团的高级副总裁刘伟光与爱诗科技创始人兼 CEO 王长虎共同见证了这一重要时刻。根据协议，阿里云将为爱诗科技提供包括基础设施和大模型服务在内的全栈 AI 支持，并借助全球化的部署和安全合规能力，全面支持爱诗科技自研的 PixVerse 视频生成大模型的训练与推理任务。阿里云正式成为爱诗科技的 “全球云合作伙伴”，其服务已经覆盖了美国西部和东部等多个区域。这将大大加速爱诗科技的 AI 视频服务的全球化进程。

爱诗科技成立于2023年4月，短短两年内便保持着高频的迭代节奏，尤其是在视频生成技术方面不断取得突破。目前，其自研的视频生成大模型已经完成了五次迭代，提升了极速生成、多镜头音画同步、视频编辑等多种能力，旨在将 AI 视频技术从专业工具普及到大众应用。最新上线的 V5.5版本更是简化了复杂的工作流程，支持智能运镜和音画同步生成，使普通用户的创作效率提高了80%。

目前，PixVerse 的全球用户已经突破了1亿。值得一提的是，今年9月，PixVerse V5在全球 AI 视频模型榜单中荣获 “图生视频” 类别第一，并入选 a16z “全球 Top50生成式 AI 消费移动应用” 榜单，位列第25名。得益于模型和产品的快速发展，爱诗科技也成功推动了全球用户增长的飞轮效应。

划重点:

📈 爱诗科技与阿里云签署全面合作协议，旨在推动 AI 视频全球化发展。

🌍 阿里云将为爱诗科技提供全栈 AI 支持，助力 PixVerse 视频生成大模型的训练与推理。

🚀 PixVerse 全球用户已突破1亿，并在全球 AI 视频模型榜单中名列前茅。

via AI新闻资讯 (author: AI Base)

9 小时前

苹果 Apple Music 即将与 ChatGPT 集成

OpenAI应用首席执行官 Fidji Simo 在社交平台发布的一篇帖子中透露 Apple Music 成为即将与ChatGPT集成的合作伙伴之一。回顾去年十月，OpenAI在ChatGPT中引入应用功能，开启了其生态构建的重要一步。Simo在帖子中表示，在不久之后，ChatGPT的新目录中将迎来更多应用程序的加入。除了已经公布的 Adobe、Airtable、Apple Music、Clay、Lovable、OpenTable、Salesforce 和 Replit 外，其他开发者也有机会提交他们的应用程序以供审核。这一动态很可能意味着 Apps SDK 即将结束预览阶段，正式进入广泛应用时期，而OpenAI也一直在积极寻求与更多高调、知名的企业进行集成合作。

—— 环球网、9to5mac

via 风向旗参考快讯 - Telegram Channel

10 小时前

Meta全面拥抱竞品AI：员工可自由调用ChatGPT-5、Gemini 3 Pro，甚至用Midjourney画图

在“AI优先”战略的驱动下，Meta正彻底打破技术阵营壁垒——这家曾以Llama开源模型为傲的社交巨头，如今不仅允许员工广泛使用谷歌、OpenAI、Anthropic等竞争对手的AI工具，更将之深度融入日常办公全流程，从编码、写作到设计、决策，无一例外。

据Business Insider披露的内部文件，Meta员工目前已可合法调用包括OpenAI的ChatGPT-5、谷歌的Gemini 3 Pro、Anthropic的Claude（通过内部编程工具Devmate）等顶级外部模型。 6 月，首席信息官阿蒂什·班纳吉在全员备忘录中明确表示：“让AI成为我们工作方式的核心”是公司首要任务之一，并强调“不拘泥于自研技术，而是聚焦实际成效”。

Meta内部AI工具矩阵已形成“混合智能”生态：

- Agentic Auto：顶级智能体，支持工具调用与子智能体协作，集成GPT-5 Thinking后可延长推理时间输出更优答案；

- iLlama：基于Llama 3. 1 优化的内部快模型，专解Meta业务问题；

- Llama 4 Maverick：不含公司敏感数据的公开版模型；

- Devmate：编程助手，底层调用Claude；

- Metamate：基于Llama的通用内部AI助手。

更引人注目的是，Meta甚至将Midjourney图像生成技术正式纳入员工工作流。今年 10 月，该工具向全员开放，用于“概念设计与生产制作”，加速创意原型开发。这标志着Meta在视觉生成领域也选择“拿来主义”，而非完全依赖自研Vibes等产品。

基础设施层面，Meta已将整个办公套件迁移至Google Workspace——邮箱、文档、云端硬盘、聊天全部切换，理由是“解锁AI驱动功能”并与Gemini、NotebookLM Pro等工具无缝集成。这一举动，无异于在微软与谷歌的云办公战争中，公开站队后者。

为激励AI应用，Meta还推出名为“能力进阶”（Level Up）的内部游戏化系统：员工使用AI完成任务可获徽章，绩效考核将逐步纳入“AI创造价值”指标，并计划在 2026 年全面实施。

讽刺而务实的是，这家投入数百亿美元打造Llama生态的公司，如今却坦然承认：单一技术栈无法满足复杂工作场景。正如“现实实验室”高管马赫·萨巴所言：“我们的核心不是用谁的模型，而是让员工获得最优质的智能体验。”

在AI军备竞赛中，Meta的选择传递出一个清晰信号：真正的护城河，不是模型归属，而是组织对技术的开放心态与整合能力。当Llama与GPT、Gemini、Claude共存于一个工程师的终端，Meta的“AI优先”才真正从口号落地为生产力。

via AI新闻资讯 (author: AI Base)

10 小时前

重庆出台“人工智能+”行动方案，全面布局AI终端生态，打造智能原生产业高地

重庆市近日正式发布《重庆市推动“人工智能+”行动方案》，明确提出以“智能原生”为核心导向，系统性培育AI驱动的消费新产品、新服务与新业态，加速构建覆盖个人、家庭与商业场景的全栈式人工智能终端生态。

方案聚焦六大重点方向，全方位推动AI与硬件深度融合:

1. 智能终端设备升级

支持研发具备多模态交互与深度意图理解能力的AI手机、AI计算机，突破传统人机交互边界，使设备从“被动响应”转向“主动服务”。

2. 全屋智能家电生态

鼓励开发AI冰箱、AI洗衣机、AI洗护设备等新一代智能家电，通过感知用户习惯、自动优化运行策略，实现家电从“联网控制”向“自主决策”演进，打造真正意义上的智慧家庭。

3. 具身智能机器人落地

围绕物流配送、商场导购、社区服务等高频场景，推动具身智能机器人解决方案商业化，探索“机器人即服务”（RaaS）新模式，创新产品形态与运营机制。

4. 智能穿戴设备突破

加速研发AI眼镜、AI手表及AR/VR设备，融合实时环境感知、语音交互与情境计算能力，使穿戴设备成为个人AI助理的物理载体。

5. 智能原生商业模式探索

鼓励企业基于AI原生技术重构产品逻辑与服务流程，发展“AI-first”而非“AI-added”的全新商业范式，催生如个性化健康管家、沉浸式零售导购、自主家居运维等新兴业态。

6. 产业生态协同构建

通过政策引导、场景开放与标准制定，推动芯片、算法、终端、应用企业协同创新，形成“技术研发—产品落地—场景验证—规模推广”的闭环。

重庆此次行动方案的出台，标志着其正从“应用AI”迈向“原生AI”战略新阶段。在国家大力推进“人工智能+”行动的背景下，重庆以终端产品为突破口，试图抢占AI消费级市场的先机，打造具有全国影响力的智能原生产业聚集区。未来，从你手腕上的AI手表到厨房里的智能冰箱，都可能成为“重庆智造”在AI时代的新名片。

via AI新闻资讯 (author: AI Base)

10 小时前

腾讯发布混元世界模型 1.5，开启实时交互的虚拟世界

via AI新闻资讯 (author: AI Base)

Telegraph

腾讯发布混元世界模型 1.5，开启实时交互的虚拟世界

腾讯正式发布了混元世界模型1.5（Tencent HY WorldPlay），这是国内首个开放的实时互动体验平台。该模型通过简单的文字描述或图片，就能迅速生成独特的互动世界，用户能够通过键盘、鼠标或手柄实时控制虚拟相机，像玩游戏一样自由探索这些由 AI 生成的场景。混元世界模型1.5具备三大核心能力:首先，实时交互生成能力，借助原创的 Context Forcing 蒸馏方案和流式推理优化，模型能够以24帧每秒的速度生成720P 的高清视频。其次，模型具备长范围的3D 一致性，这意味着用户在离开某个区域后再次返回时，模型能够准确…

10 小时前

小米发布新一代 MoE 大模型 MiMo-V2-Flash，助力 AGI 发展

在今天的2025小米人车家全生态合作伙伴大会上，小米新任 Xiaomi MiMO 大模型负责人罗福莉首次亮相，正式发布了最新的 MoE（Mixture of Experts）大模型 ——MiMo-V2-Flash。这一全新的模型被认为是小米在实现人工通用智能(AGI)目标上的第二步。

罗福莉在社交媒体上详细介绍了 MiMo-V2-Flash 的技术架构。该模型采用了 Hybrid SWA 架构，这种设计既简单又优雅，并且在长上下文推理方面，表现明显优于其他线性注意力变体。值得一提的是，窗口大小128被认为是最佳选择，过大的窗口反而会降低模型性能。同时，固定的 KV 缓存设计提高了与现有基础设施的兼容性。

此外，罗福莉还谈到了一项关键技术 —— 多标记预测（MTP）。通过采用 MTP，模型在高效的强化学习(RL)中取得了显著的提升。即使在第一层以外，MTP 也只需要少量微调，就能实现较高的接受长度。三层 MTP 在编程任务中的表现更是突出，实现了接受长度大于3，并且速度提升约2.5倍，这有效解决了小批量 On-Policy RL 中的 GPU 空转问题。

在后训练阶段，小米采用了 Thinking Machine 提出的 On-Policy Distillation，旨在融合多个 RL 模型。通过这一方法，小米成功地在传统的 SFT 和 RL 流程中，计算量仅为其1/50的情况下达到了教师模型的性能。这一过程显示出学生模型不断进化的潜力，最终形成自我强化的闭环。

罗福莉表示，团队在短短几个月内将这些理念转化为可上线的生产系统，展现了非凡的效率与创造力。

划重点:

🌟 MiMo-V2-Flash 是小米在实现 AGI 目标的第二步，具备先进的 MoE 架构。

⚡ 采用的多标记预测技术显著提升了模型性能与速度。

💡 后训练阶段融合多个 RL 模型，展现出强大的自我强化能力。

via AI新闻资讯 (author: AI Base)

11 小时前

谷歌实验室推出 AI 助手 CC:集成 Gemini 技术，打造智能“日程管家”

谷歌实验室近日发布了基于 Gemini 技术构建的全新实验性人工智能生产力助手 CC。据 AIbase 报道，这款工具旨在通过深度整合谷歌生态系统，帮助用户实现全自动化的日程梳理与任务管理，让高效工作变得触手可及。

注册并授权后，CC 将无缝连接用户的 Gmail、谷歌日历、谷歌云端硬盘以及更广泛的网络信息，深入理解用户的每日活动。其核心功能是每天清晨向用户收件箱发送一份“您的一天预览”简报。这份简报将日程安排、关键任务和最新动态综合整理成清晰的摘要，无论是提醒支付账单还是准备会议预约，都能让用户对后续行动一目了然。

为了进一步提升效率，CC 还能根据需求预先准备好电子邮件草稿和日历链接。用户甚至可以直接通过回复邮件或发送自定义请求来指导 CC，让它记住灵感想法、更新待办事项，或通过交流让它更了解自己的偏好。

作为谷歌 Labs 的一项早期实验，CC 目前已向美国和加拿大18岁及以上的谷歌消费者账户开放早期访问权限，首批覆盖人群包括 Google AI Ultra 用户和付费订阅用户。符合条件的对口地区用户现可通过官方网站注册加入等候名单，体验这一将想法与行动无缝衔接的 AI 创意助手。

via AI新闻资讯 (author: AI Base)

11 小时前

何小鹏硅谷归来感悟:物理 AI 迎来三年爆发期，人形机器人将成巨头“大逃杀”

12月17日，小鹏汽车董事长何小鹏在朋友圈发文分享了其赴美交流后的深度洞察。何小鹏在与硅谷近三十位 AI 专家交流后指出，当前 AI 领域整体不存在泡沫，行业正处于从0到0.1的起步阶段。

他特别强调，虽然数字 AI 领域如 OpenAI 正在全力推进业务落地，但未来三年最有可能产生大变局的是物理 AI 领域。他预判自动驾驶将直接跨越至准 L4或完整 L4级别，而人形机器人也将实现从 L1到 L4初阶的快速性能飞跃。

在机器人赛道上，他敏锐地察觉到中美路径的差异:中国公司多从关节和控制入手，而美国公司则更倾向于从模型切入。他认为人形机器人未来将是巨头间的终极竞争，但不同领域的专用机器人仍为大量选手留下了成功的机会。

谈及 AGI（通用人工智能）的到来，何小鹏持理性态度。他认为目前的 AI 主要处于“模仿学习+强化学习”阶段，虽然在自动驾驶等领域展现出了超越人类的涌现能力，但这并非真正的创造力。真正的 AGI 还需要具备从多模态到世界模型的深度理解能力、持续学习能力以及长时序的规划洞见，而这些核心能力的完善可能还需数年时间。

针对中美市场的对比，他指出美国 AI 创业项目估值普遍偏高且更关注前沿研究，而中国企业的估值相对合理并更聚焦于市场应用。他总结道，尽管物理 AI 的发展速度可能慢于数字世界，但其对人类生活产生的变革力度将更加巨大。

via AI新闻资讯 (author: AI Base)

Before

After

Home