https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
据韩国媒体报道,三星代工业务正迎来强势反弹,在接连获得特斯拉和高通的订单后,三星又拿下NVIDIA新一代AI推理芯片"Grok 3 LPU"的生产合同,目前正与AMD洽谈下一代芯片的代工合作。
NVIDIA CEO黄仁勋在GTC 2026演讲中宣布,三星电子将负责生产Grok 3 LPU推理芯片,这是NVIDIA以200亿美元收购Groq后推出的首款产品,瞄准的是AI市场向智能体AI转型所带来的推理芯片需求爆发。
三星已启动Grok 3 LPU的量产工作,预计今年第三季度开始出货。
据行业人士透露,三星代工部门内部已将今年第四季度设定为扭亏目标节点,证券分析师同样预测,三星代工业务从今年下半年起将大幅收窄亏损幅度,最快第四季度即可实现盈利。
技术层面,三星2nm工艺良率已趋于稳定,美国德州Taylor工厂计划于今年下半年投产,届时产能将显著提升。
此前,三星代工因先进制程前期投入巨大、良率长期低于预期,一直被市场视为三星Device Solutions(DS)部门的"问题业务"。
另外三星代工在全球晶圆代工市场的份额此前持续下滑,一度跌至个位数,随着2nm工艺成熟和大客户订单回流,这一趋势有望在今年得到扭转。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
SE 将在《勇者斗恶龙X》中集成 Google Gemini
2026-03-23 13:18 by 泰山和蚁人
史克威尔艾尼克斯(Square Enix)宣布将在其热门网游《勇者斗恶龙X》中集成 Google 的 Gemini 模型,允许玩家与其对话,为新手玩家提供导引方面的帮助。《勇者斗恶龙X》还将加入一个集成生成式 AI 的新伙伴角色 Chatty Slimey,当玩家使用聊天功能与其对话时,它会自动生成语音进行互动。如果玩家击败强敌或获得稀有道具,Slimey 还可能主动发起对话。《勇者斗恶龙X》于 2012 年上线,中国版于 2016 年上线,由盛大游戏运营,但在 2019 年就终止了服务。《勇者斗恶龙X》运营已超过十年,每月仍然有数十万活跃玩家,但如何吸引新玩家是其面临的一大挑战。
https://www.sankei.com/article/20260321-3TH3XQRCSFI7BM6L2ZLNU45UNY/
https://zh.wikipedia.org/wiki/%E5%8B%87%E8%80%85%E6%96%97%E6%81%B6%E9%BE%99X
#人工智能
via Solidot - Telegram Channel
2026-03-23 13:18 by 泰山和蚁人
史克威尔艾尼克斯(Square Enix)宣布将在其热门网游《勇者斗恶龙X》中集成 Google 的 Gemini 模型,允许玩家与其对话,为新手玩家提供导引方面的帮助。《勇者斗恶龙X》还将加入一个集成生成式 AI 的新伙伴角色 Chatty Slimey,当玩家使用聊天功能与其对话时,它会自动生成语音进行互动。如果玩家击败强敌或获得稀有道具,Slimey 还可能主动发起对话。《勇者斗恶龙X》于 2012 年上线,中国版于 2016 年上线,由盛大游戏运营,但在 2019 年就终止了服务。《勇者斗恶龙X》运营已超过十年,每月仍然有数十万活跃玩家,但如何吸引新玩家是其面临的一大挑战。
https://www.sankei.com/article/20260321-3TH3XQRCSFI7BM6L2ZLNU45UNY/
https://zh.wikipedia.org/wiki/%E5%8B%87%E8%80%85%E6%96%97%E6%81%B6%E9%BE%99X
#人工智能
via Solidot - Telegram Channel
🔁 #Tip #Codex #Claude
Forwarded From Agent Copilot
#Tip #Codex #Claude
Codex 最佳实践:https://developers.openai.com/codex/learn/best-practices
Claude Code 最佳实践:https://code.claude.com/docs/en/best-practices
via AI Copilot - Telegram Channel
Forwarded From Agent Copilot
#Tip #Codex #Claude
Codex 最佳实践:https://developers.openai.com/codex/learn/best-practices
Claude Code 最佳实践:https://code.claude.com/docs/en/best-practices
via AI Copilot - Telegram Channel
Cursor 承认新模型 Composer 2 基于国产大模型 Kimi 研发
在本周引发行业轰动的 Composer 2 发布会后,顶尖 AI 编程工具 Cursor 陷入了一场关于“原创性”的舆论风暴。起因是一位社交媒体用户通过代码取证指出,这款号称拥有“巅峰级编程智慧”的新模型,其底层竟然是月之暗面(Moonshot AI)近期发布的开源模型 Kimi 2.5。
面对质疑,Cursor 开发教育副总裁 Lee Robinson 迅速作出回应,坦诚 Composer 2 确实是在开源基座的基础上构建的。这一表态迅速反转了此前的“纯自研”印象,也让国产大模型在国际顶尖工具中的渗透力成为焦点。
是“搬运”还是“深度重塑”?
针对外界对于其高估值的质疑,Cursor 方面给出了详细的技术解释。Robinson 指出,虽然使用了 Kimi 作为基座,但最终模型仅有约四分之一的算力消耗花在基座上,其余四分之三的算力均用于 Cursor 自身的预训练和高强度强化学习(RL)。
这意味着,Composer 2 在各种基准测试中的表现已经与原生 Kimi 拉开了显著差距。Cursor 试图通过这一数据证明,虽然“地基”来自中国,但其上层建筑的“编程灵魂”是由 Cursor 注入的。
合规的商业伙伴,而非“偷师”
值得注意的是,这场争议并未演变成法律纠纷。月之暗面(Kimi)官方账号随后在 X 平台上公开祝贺 Cursor,并确认双方通过 Fireworks AI 达成了授权商业合作伙伴关系。Kimi 团队表示,非常自豪能看到自己的模型作为底座,通过 Cursor 的持续训练为全球开发者创造价值。
既然是合规合作,Cursor 为何在最初的发布公告中对 Kimi 绝口不提?Cursor 联合创始人 Aman Sanger 承认这是一个“疏忽”,并承诺将在下一个模型中予以修正。
然而,行业分析普遍认为,这反映了当前 AI 领域敏感的“军备竞赛”心理。作为一家估值近 300 亿美元、年营收超 2 亿美元的美国明星初创公司,承认核心产品依赖中国模型,在当前的政治和市场环境下显然具有一定的心理压力。
via AI新闻资讯 (author: AI Base)
在本周引发行业轰动的 Composer 2 发布会后,顶尖 AI 编程工具 Cursor 陷入了一场关于“原创性”的舆论风暴。起因是一位社交媒体用户通过代码取证指出,这款号称拥有“巅峰级编程智慧”的新模型,其底层竟然是月之暗面(Moonshot AI)近期发布的开源模型 Kimi 2.5。
面对质疑,Cursor 开发教育副总裁 Lee Robinson 迅速作出回应,坦诚 Composer 2 确实是在开源基座的基础上构建的。这一表态迅速反转了此前的“纯自研”印象,也让国产大模型在国际顶尖工具中的渗透力成为焦点。
是“搬运”还是“深度重塑”?
针对外界对于其高估值的质疑,Cursor 方面给出了详细的技术解释。Robinson 指出,虽然使用了 Kimi 作为基座,但最终模型仅有约四分之一的算力消耗花在基座上,其余四分之三的算力均用于 Cursor 自身的预训练和高强度强化学习(RL)。
这意味着,Composer 2 在各种基准测试中的表现已经与原生 Kimi 拉开了显著差距。Cursor 试图通过这一数据证明,虽然“地基”来自中国,但其上层建筑的“编程灵魂”是由 Cursor 注入的。
合规的商业伙伴,而非“偷师”
值得注意的是,这场争议并未演变成法律纠纷。月之暗面(Kimi)官方账号随后在 X 平台上公开祝贺 Cursor,并确认双方通过 Fireworks AI 达成了授权商业合作伙伴关系。Kimi 团队表示,非常自豪能看到自己的模型作为底座,通过 Cursor 的持续训练为全球开发者创造价值。
既然是合规合作,Cursor 为何在最初的发布公告中对 Kimi 绝口不提?Cursor 联合创始人 Aman Sanger 承认这是一个“疏忽”,并承诺将在下一个模型中予以修正。
然而,行业分析普遍认为,这反映了当前 AI 领域敏感的“军备竞赛”心理。作为一家估值近 300 亿美元、年营收超 2 亿美元的美国明星初创公司,承认核心产品依赖中国模型,在当前的政治和市场环境下显然具有一定的心理压力。
via AI新闻资讯 (author: AI Base)
MiniMax(稀宇科技)于2026年3月23日宣布将其原有的Coding Plan全面升级为“Token Plan”,推出全球首个支持全模态模型的订阅计划。此次升级标志着MiniMax从单一编程提效工具向全场景专业办公与创作生态的战略扩张。通过统一的Token Plan Key,用户现可调用包括最新M2.7编程模型、Hailuo视频模型、Speech语音模型、Music音乐模型及Image图像生成模型在内的全系多模态能力,实现了单一订阅覆盖文、图、音、视全维度创作需求。
在产品架构上,Token Plan延续了原Coding Plan的编程模型用量标准(按5小时周期计调),并为Plus及以上套餐用户新增了独立的多模态调用额度,不占用原编程模型点数。针对专业开发者的高并发需求,MiniMax同步推出了支持Speech2.8旗舰语音模型与Hailuo2.3/2.3-Fast视频模型的专用资源包,较按量付费模式可节省约20%的成本。为应对M2.7上线后爆发式的流量增长,MiniMax引入了行业惯例的动态调控机制,在工作日高峰时段实施限流策略,并推荐超高并发任务转向不受限制的“按量付费”API模式。
此次全模态订阅制的落地,反映出头部大模型厂商正在从“单点技术突破”转向“综合服务集成”。通过将多模态能力整合进统一的付费框架,MiniMax不仅降低了开发者构建复杂Agent的门槛,也为大模型行业的商业化路径提供了新的范式,进一步推动了AI技术从实验性调用向生产力工具的深层转化。
via AI新闻资讯 (author: AI Base)
疯狂扩军!OpenAI 开启史上最大规模招聘:明年末员工数或翻倍至 8000 人
就在硅谷大厂普遍缩减开支、谨慎招人的寒冬里,人工智能领头羊 OpenAI 却反其道而行之,准备拉开一场震撼行业的“抢人大战”。据知情人士透露,OpenAI 内部正酝酿一项宏大的扩张计划,旨在通过大规模的人才引进,应对当前进入白热化的全球 AI 竞赛。
消息显示,OpenAI 计划在短时间内释放约 3500 个新岗位。如果这一目标达成,到 2026 年年底,该公司的员工总数将从目前的约 4500 人激增至 8000 人。这种近乎翻倍的扩张速度,再次印证了其在技术研发与商业落地上的极度自信。
此次大规模扩员的背后,折射出 OpenAI 战略重心的重大偏移。除了继续保持在基础模型研发上的领先地位,OpenAI 正投入重金强化其企业级服务能力。随着越来越多的世界 500 强企业将业务接入 GPT 架构,OpenAI 急需大量的技术支持、销售以及行业解决方案专家,来深耕利润更丰厚的企业客户市场。
分析人士指出,当前 AI 市场的竞争早已不只是算力的比拼,更是顶级人才储备的博弈。随着 Anthropic、Google 甚至像 Cursor 这样的垂直赛道对手步步紧逼,OpenAI 必须通过吸纳全球最顶尖的工程和商业人才来巩固其“霸主”地位。
via AI新闻资讯 (author: AI Base)
就在硅谷大厂普遍缩减开支、谨慎招人的寒冬里,人工智能领头羊 OpenAI 却反其道而行之,准备拉开一场震撼行业的“抢人大战”。据知情人士透露,OpenAI 内部正酝酿一项宏大的扩张计划,旨在通过大规模的人才引进,应对当前进入白热化的全球 AI 竞赛。
消息显示,OpenAI 计划在短时间内释放约 3500 个新岗位。如果这一目标达成,到 2026 年年底,该公司的员工总数将从目前的约 4500 人激增至 8000 人。这种近乎翻倍的扩张速度,再次印证了其在技术研发与商业落地上的极度自信。
此次大规模扩员的背后,折射出 OpenAI 战略重心的重大偏移。除了继续保持在基础模型研发上的领先地位,OpenAI 正投入重金强化其企业级服务能力。随着越来越多的世界 500 强企业将业务接入 GPT 架构,OpenAI 急需大量的技术支持、销售以及行业解决方案专家,来深耕利润更丰厚的企业客户市场。
分析人士指出,当前 AI 市场的竞争早已不只是算力的比拼,更是顶级人才储备的博弈。随着 Anthropic、Google 甚至像 Cursor 这样的垂直赛道对手步步紧逼,OpenAI 必须通过吸纳全球最顶尖的工程和商业人才来巩固其“霸主”地位。
via AI新闻资讯 (author: AI Base)
3月23日,千问上线打车能力。用户可一句话完成选车型、设途经点、预约时间等操作,并支持“要空气清新的车,价格不超过30元”、“驾驶平稳”、“服务态度好”等个性化需求,行程结束后通过支付宝“AI付”直接完成付款。
具体操作仅需三步:
1.打开千问App,说出打车要求;
2.选定车型、价格后生成用车订单;
3.行程结束,点击“去支付”完成付款,支付时以面容、指纹或密码等核身,也可选择开通免密支付。
目前,除了打车,用户在千问点餐饮、囤零食百货、买电影票、订机票火车票、订酒店等消费场景,均可使用安全、便捷的支付宝“AI付”。
值得注意的是,支付宝“AI付”已成为全球首个支付笔数和用户数双双破亿的AI原生支付产品,在千问、瑞幸、Rokid等多个AI场景上线,正加速进入普及与大规模商用阶段,助力AI产业与新消费全面爆发。
via AI新闻资讯 (author: AI Base)
AI 编程界的一场“血统”争议,终于在当事方的正面回应下尘埃落定。
3月21日,针对近期热议的“Cursor 疑似套壳 Kimi K2.5”事件,月之暗面(Moonshot AI)官方发布声明。官方表示,对于 Kimi K2.5 能为这一领先的编程平台奠定技术基础感到自豪,并明确指出双方属于正式的授权商业合作。
马斯克下场“实锤”,意外引发跨国互动
此前,全球热门 AI 编程平台 Cursor 发布了全新的 Composer2 模型。然而,细心的开发者在测试中发现,该模型的内核特征与 Kimi K2.5 高度重合。这一发现迅速引发舆论发酵,甚至吸引了埃隆·马斯克的关注。马斯克在社交平台上直接评论称:“没错,这就是 Kimi2.5。”
技术出海新姿态:商业合作而非“套壳”
面对“套壳”的质疑,月之暗面 及时澄清了其中的商业逻辑:
接入路径: Cursor 是通过 Fireworks AI 托管的强化学习与推理平台,正式接入了 Kimi K2.5 的底座能力。
双赢局面: 这并非传统意义上的剽窃或简单封装,而是国产顶尖大模型作为“能力提供方”,支撑国际主流开发工具的典型案例。
国产大模型的技术“硬通货”时代
Kimi 在回应中不仅感谢了马斯克的“力挺”,更展现出作为技术底座的自信。随着 Kimi K2.5 在强化学习与复杂推理领域的表现获得国际认可,国产模型正从单纯的应用端竞争,转向输出核心技术能力的深水区。
当 Cursor 选择用 Kimi 来武装自己的编程神器,这场争议最终演变成了一次国产 AI 实力的“全球公测”。在2026年的 AI 版图中,这种授权合作或将成为常态,国产模型正以底层硬实力的姿态,重新定义全球 AI 产业链的分工。
via AI新闻资讯 (author: AI Base)
Reddit CEO 逆向抢人:不惧 AI 取代岗位,将大规模扩招“AI 原生代”应届生
当全球职场还在为“AI 是否会抢走入门级饭碗”而焦虑时,社交巨头 Reddit 却给出了截然不同的答案。Reddit 首席执行官史蒂夫·霍夫曼(Steve Huffman)近日在播客节目中公开表态:Reddit 不仅不会缩减开支,反而计划大规模招聘应届毕业生,因为他们是真正的“AI 原生一代”。
霍夫曼认为,这一届毕业生拥有天然的竞争优势。他们从大学时代起就深度借助 AI 学习编程和处理任务,这种与生俱来的“人机协作”能力,使其在进入职场时就具备了极高的生产力价值。
“顶尖人才不抢就没了”
在霍夫曼看来,招聘应届生是一场争分夺秒的竞争。他直言,那些最优秀的应届生如果不在第一时间被招入麾下,未来可能永远不会出现在求职市场上。因为他们的价值会被迅速挖掘,从而直接进入更高层级的职业路径。
这种乐观态度与科技界普遍的“悲观预测”形成了鲜明对比。此前,Anthropic 首席执行官曾预警,五年内 AI 可能会导致一半的入门级白领岗位消失。但 Reddit 坚持认为,即便 AI 能让工程师效率提升 10 倍,公司也会选择“去做 10 倍的事情”,而不是裁减人员去做同样的事。
尽管 Reddit 释放了积极信号,但当前的就业环境依然严峻。美国劳工统计局数据显示,2026 年 2 月的失业率已攀升至 4.4%,失业人数达 760 万。在企业普遍因 AI 转型而放缓招聘节奏的大环境下,Reddit 的“扩招令”无疑给年轻职场人打了一剂强心针。
目前,Reddit 已设立专门的新兴人才团队,开放了涵盖工程、销售、产品等多个全职岗位,并针对机器学习方向推出了代号为“Snooterns”的实习计划。对于 Reddit 而言,押注“AI 原生代”,不仅是为了填补岗位空缺,更是为了在这场技术变革中抢占人才的高地。
via AI新闻资讯 (author: AI Base)
当全球职场还在为“AI 是否会抢走入门级饭碗”而焦虑时,社交巨头 Reddit 却给出了截然不同的答案。Reddit 首席执行官史蒂夫·霍夫曼(Steve Huffman)近日在播客节目中公开表态:Reddit 不仅不会缩减开支,反而计划大规模招聘应届毕业生,因为他们是真正的“AI 原生一代”。
霍夫曼认为,这一届毕业生拥有天然的竞争优势。他们从大学时代起就深度借助 AI 学习编程和处理任务,这种与生俱来的“人机协作”能力,使其在进入职场时就具备了极高的生产力价值。
“顶尖人才不抢就没了”
在霍夫曼看来,招聘应届生是一场争分夺秒的竞争。他直言,那些最优秀的应届生如果不在第一时间被招入麾下,未来可能永远不会出现在求职市场上。因为他们的价值会被迅速挖掘,从而直接进入更高层级的职业路径。
这种乐观态度与科技界普遍的“悲观预测”形成了鲜明对比。此前,Anthropic 首席执行官曾预警,五年内 AI 可能会导致一半的入门级白领岗位消失。但 Reddit 坚持认为,即便 AI 能让工程师效率提升 10 倍,公司也会选择“去做 10 倍的事情”,而不是裁减人员去做同样的事。
尽管 Reddit 释放了积极信号,但当前的就业环境依然严峻。美国劳工统计局数据显示,2026 年 2 月的失业率已攀升至 4.4%,失业人数达 760 万。在企业普遍因 AI 转型而放缓招聘节奏的大环境下,Reddit 的“扩招令”无疑给年轻职场人打了一剂强心针。
目前,Reddit 已设立专门的新兴人才团队,开放了涵盖工程、销售、产品等多个全职岗位,并针对机器学习方向推出了代号为“Snooterns”的实习计划。对于 Reddit 而言,押注“AI 原生代”,不仅是为了填补岗位空缺,更是为了在这场技术变革中抢占人才的高地。
via AI新闻资讯 (author: AI Base)
开发者狂欢!小米 MiMo 大模型联合 OpenClaw 等五大框架,开启首周限免
在自研大模型密集发布的冲刺期,小米 正在通过“生态联姻”的方式,迅速扩大其 AI 技术的全球影响力。
3月21日,小米 官方宣布,旗下全新的 MiMo-V2-Pro、MiMo-V2-Omni 以及 MiMo-V2-TTS 大模型已正式发布。为了加速开发者生态的构建,小米此次联动 OpenClaw、OpenCode、KiloCode、Cline 及 BLACKBOXAI 五大主流 Agent 框架,向全球开发者开放为期一周的免费 API 接口。
主流框架全线适配,实现“开箱即用”
此次限免活动几乎覆盖了当前最受关注的 AI 智能体与编程辅助工具,开发者可以通过以下方式轻松接入:
OpenClaw: 支持通过 OpenRouter 官方 API Key 进行配置,用户只需在终端或配置文件中简单设置即可调用 Pro 或 Omni 模型。
编程增强(OpenCode/KiloCode): 开发者在桌面应用或 IDE 扩展插件中,直接选择标有“FREE”字样的 MiMo 系列模型即可开启高效开发。
语音合成(MiMo-V2-TTS): 官方 API 开放平台同步上线,支持开发者参考调用指南实现细腻的语音交互功能。
不仅是免费,更是对生态的深度卡位
自深夜上线三大自研模型以来,小米的 AI 战略路径已愈发清晰。通过在 OpenRouter 等聚合平台上提供限免额度,小米不仅降低了全球开发者的试用门槛,更是在 OpenClaw(龙虾)等开源智能体爆火的当下,实现了对核心流量入口的精准占位。
从旗舰级的 MiMo-V2-Pro 到全模态基座 MiMo-V2-Omni,小米正在向外界证明,其 AI 能力已不仅仅服务于手机和汽车,而是具备了支撑全球开发者构建复杂 Agent 系统的硬实力。随着首周限免的开启,这场关于“生态抢摊”的竞速赛已经进入白热化阶段。
via AI新闻资讯 (author: AI Base)
在自研大模型密集发布的冲刺期,小米 正在通过“生态联姻”的方式,迅速扩大其 AI 技术的全球影响力。
3月21日,小米 官方宣布,旗下全新的 MiMo-V2-Pro、MiMo-V2-Omni 以及 MiMo-V2-TTS 大模型已正式发布。为了加速开发者生态的构建,小米此次联动 OpenClaw、OpenCode、KiloCode、Cline 及 BLACKBOXAI 五大主流 Agent 框架,向全球开发者开放为期一周的免费 API 接口。
主流框架全线适配,实现“开箱即用”
此次限免活动几乎覆盖了当前最受关注的 AI 智能体与编程辅助工具,开发者可以通过以下方式轻松接入:
OpenClaw: 支持通过 OpenRouter 官方 API Key 进行配置,用户只需在终端或配置文件中简单设置即可调用 Pro 或 Omni 模型。
编程增强(OpenCode/KiloCode): 开发者在桌面应用或 IDE 扩展插件中,直接选择标有“FREE”字样的 MiMo 系列模型即可开启高效开发。
语音合成(MiMo-V2-TTS): 官方 API 开放平台同步上线,支持开发者参考调用指南实现细腻的语音交互功能。
不仅是免费,更是对生态的深度卡位
自深夜上线三大自研模型以来,小米的 AI 战略路径已愈发清晰。通过在 OpenRouter 等聚合平台上提供限免额度,小米不仅降低了全球开发者的试用门槛,更是在 OpenClaw(龙虾)等开源智能体爆火的当下,实现了对核心流量入口的精准占位。
从旗舰级的 MiMo-V2-Pro 到全模态基座 MiMo-V2-Omni,小米正在向外界证明,其 AI 能力已不仅仅服务于手机和汽车,而是具备了支撑全球开发者构建复杂 Agent 系统的硬实力。随着首周限免的开启,这场关于“生态抢摊”的竞速赛已经进入白热化阶段。
via AI新闻资讯 (author: AI Base)
在大模型向垂直专业领域进军的征途中,美团 刚刚交出了一份令学术界与工业界瞩目的答卷。
3月21日,美团 正式开源了名为 LongCat-Flash-Prover 的超大规模数学证明模型。这款拥有 5677亿参数 的巨兽,采用了先进的 MoE(混合专家模型)架构,专门针对极其复杂的数学形式化证明问题进行了深度优化。
在衡量模型逻辑推理能力的顶级基准测试中,LongCat-Flash-Prover 展现出了统治级的实力:
刷新纪录: 在 MiniF2F-Test 测试中取得了 97.1% 的惊人成绩,仅需72次推理尝试。
攻克难题: 在 PutnamBench 任务中成功解决了41.5% 的问题,上述两项数据均刷新了全球 SOTA(当前最佳)水平。
为了让大模型真正拥有“数学家”般的严谨,美团 在技术路径上实现了多项关键突破:
消除幻觉: 引入了基于 AST(抽象语法树)的多阶段严格验证流程,并整合 Lean4形式化语言,从根源上杜绝了 AI 在逻辑推演中的“胡言乱语”。
训练算法进化: 针对 MoE 模型长程任务训练不稳的顽疾,美团引入了自研的 HisPO 算法,并配合定理一致性检测机制,有效防止了模型在强化学习阶段出现“投机取巧”的奖励黑客行为。
高效架构:5600亿的总参数量确保了模型深厚的知识底蕴,而MoE架构则保证了推理时的灵活性与高效性。
目前,美团 已将该模型及其代码在 GitHub 和 Hugging Face 平台全面开源。
随着 LongCat-Flash-Prover 的亮相,国产大模型在数学逻辑、代码验证等高阶推理领域的竞争力得到了有力证明。当复杂的定理证明不再仅仅依赖人类头脑,而是能通过百亿级激活参数的专家模型精准破解,AI 距离实现真正的“通用人工智能”又迈出了扎实的一步。
via AI新闻资讯 (author: AI Base)
在2026年中国发展高层论坛年会上,小米集团雷军明确表示,备受关注的电脑版AI智能体“龙虾”(MiClaw)已列入开发计划。此前,小米已于3月6日开启手机版MiClaw的小范围封测,并于3月19日的春季新品发布会上释放了跨端协作的信号。随着小米自研大模型MiMo-V2-Pro于上周正式实现全平台上线,MiClaw功能同步迎来全面更新并开放体验。
作为具备实打实任务执行能力的AI智能体,MiClaw与传统语音助手有着本质区别,其核心定位是通过接入大模型实现复杂指令的自动化处理,而非单纯的逻辑思考。在MiMo-V2-Pro的赋能下,MiClaw已深度融入小米“人车家全生态”,支持本地化部署以强化隐私安全,用户通过自然语言即可实现对手机及米家智能设备的自定义联动。尽管当前市场热度在经历首轮爆发后趋于理性,但电脑版MiClaw的开发被视为完善生态闭环的关键一步。
小米目前正致力于攻克电脑端更复杂的办公数据处理与权限规范难题。一旦电脑版正式落地,将实现手机与PC两大核心终端的AI智能体打通。在当前AI Agent向生产力工具进化的趋势下,小米此举不仅强化了其在消费电子领域的AI竞争力,也预示着大模型应用正从简单的对话交互向全场景、系统级的自主任务执行深度转型。
via AI新闻资讯 (author: AI Base)