https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
AI公司Anthropic计划允许员工股权套现

据知情人士透露,AI初创公司Anthropic正推进一项股权出售协议,允许部分员工以至少3500亿美元的公司估值出售所持股份。该计划推进的同时,这家AI公司还在进行一轮融资,募资规模有望超过 200亿美元。此次股权要约收购,将让这家全球估值最高的人工智能初创企业之一的员工变现部分股权。知情人士称,3500亿美元估值与公司本轮融资谈判中的估值一致,且为投前估值,即不包含本轮募集资金。此次股权要约收购的具体细节仍未最终敲定。这笔二级交易的资金正由投资者筹备,最终交易规模将取决于符合条件的在职及前员工决定出售的股份数量。

—— 彭博社

via 风向旗参考快讯 - Telegram Channel
2026春晚新科技来袭!8K、AIGC特效引领观众体验新高度

在2026年春节联欢晚会的发布会上,中央广播电视总台(央视)宣布了一系列科技创新,将为观众带来前所未有的视听盛宴。此次春晚将在多个方面实现 “首次”,不仅在技术上突破,也在节目内容上进行大胆探索。

首先,春晚将在制作中全面应用8K 超高清技术,并使用全国产化设备,确保画面质量的同时,提升观众的沉浸感。此外,央视最新研发的 “央视听媒体大模型2.0” 将首次应用于内容制作,利用人工智能生成影像和超写实数字人,提高节目制作的质量和效率。这一系列的科技创新,旨在为全球华人呈现一场既有思想性又具艺术性的 “文化年夜饭”。

在舞台设计方面,春晚的演播大厅将使用14组数控翻转模块,打造出 “奔马” 主题的舞美装置。结合灯光与色彩的巧妙运用,舞台效果将如万马奔腾般壮观。此外,节目中还将引入 AIGC(人工智能生成内容)实景特效技术,创造出互动奇观,让观众在观看过程中产生身临其境的感觉。

为了进一步提升观众的观看体验,春晚将实现大小屏的无缝切换。观众可以通过央视频客户端在电视大屏与手机小屏之间轻松切换,享受超高清的直播与点播服务。并且,春晚将首次提供无障碍版本,通过手语表演和 AI 生成字幕,确保每位观众都能无障碍欣赏节目。

2026年春晚将由任鲁豫、撒贝宁等知名主持人共同带来,而各分会场的主持人阵容也各具特色,展现出多元的文化魅力。通过各种艺术形式的融合,春晚将呈现出丰富多彩的节目,期待在这个特殊的夜晚与观众共度美好时光。

via AI新闻资讯 (author: AI Base)
松下增设首席人工智能官,发力2026“增长阶段转向”

2月4日,全球科技巨头松下(Panasonic)正式宣布了一项重大的高管架构调整。为了在日益激烈的技术竞争中抢占先机,松下决定设立两个核心管理职位:首席人工智能官(CAIO)与解决方案营收官(SRO)。这一变动定于今年4月1日正式生效,标志着松下已将人工智能技术从单纯的技术研发提升至集团战略转型的核心地位。

在本次架构调整中,**榊原彰(Akira Sakakibara)**被任命为松下首任 CAIO。作为集团 AI 战略的领航员,他将负责统筹人工智能在解决客户痛点及优化内部运营效率方面的全面落地。同时,Hirofumi Suzuki 被任命为 SRO,其职责是统筹跨领域举措,专门优化被列为优先领域的解决方案业务的盈利结构,确保技术投入能有效转化为商业利润。

松下此次设立 CAIO 并非偶然,而是其2026年“增长阶段转向”计划的关键一步。集团首席执行官楠见雄规(Yuki Kusumi)在新年致辞中明确将2026年定位为“实现增长阶段转型的关键年”。通过在 C-suite(执行管理层)增设 AI 专项负责人,松下意在打破传统制造业各业务板块间的“烟囱式”结构,利用生成式 AI 和自动化技术重塑供应链,从根本上改变固定成本结构并提升企业价值。

除了增设新职位,松下还推行了更为激进的**“业务 CEO”管理机制**。运营公司的总裁将同时担任松下控股公司的业务首席执行官,这一制度旨在实现“集团整体优化”。通过让一线业务负责人直接参与集团决策,松下试图解决大型企业长期存在的决策迟缓问题,确保 AI 战略能够迅速在各个运营子公司中实现高标准化、高效率的执行。

via AI新闻资讯 (author: AI Base)
🌐 ChatGPT 经历短暂故障后已恢复正常运行

OpenAI 旗下的聊天机器人 ChatGPT 在周二经历短暂故障后已恢复上线。断网追踪网站 Downdetector 的数据显示,此次故障在高峰期影响了超过 1.3 万名美国用户。截至美东时间下午 4:33,故障报告数已降至 309 份。OpenAI 官方表示,已查明问题原因并采取了相应的缓解措施,目前正在持续监控系统的恢复情况。

(路透社)

via 茶馆 - Telegram Channel
谷歌新功能曝光!让 AI Gemini 为你操控安卓手机,完成日常任务

最新消息显示,谷歌正在测试一种名为 “屏幕自动化” 的功能,旨在让其 AI 助手 Gemini 能够直接操控安卓手机,为用户完成下单、预约等日常事务。该功能在最近的谷歌应用 17.4 测试版中首次亮相,代号 “倭黑猩猩(bonobo)”。

根据 9to5google 的报道,这项功能能够通过屏幕自动化技术,让 Gemini 在用户的设备上执行特定应用中的任务。用户可以通过简单的指令,让 Gemini 帮忙完成例如在线购物、预约服务等一系列操作。这一功能得益于 Android 16 QPR3 版本的技术基础,为未来的智能操作铺平了道路。

不过,谷歌对此也做出了提醒:虽然 Gemini 在技术上可以辅助用户,但操作过程中可能会出现失误,因此用户需要密切关注其执行情况,并对其行为负责。在必要时,用户可以随时中断 Gemini 的操作,亲自接管任务。

此外,关于用户隐私的保护措施也得到了强化。当 Gemini 与应用进行交互时,用户可以选择开启活动记录保存功能,但需要注意,截取的屏幕画面将由专业审核人员进行检查,以优化谷歌的各项服务。谷歌建议用户在使用该功能时,尽量避免输入敏感信息,如登录凭证或支付信息,以防止个人隐私泄露。

在测试版中,谷歌还透露了一项名为 “芥末(wasabi)” 的数字形象功能,它将为用户提供 3D 虚拟形象,在谷歌 Meet 通话中使用,增强用户体验。

总之,随着 Gemini 操控手机的功能逐渐成型,我们可以期待这位智能助手在日常生活中扮演更重要的角色,助力用户高效完成各项任务。

via AI新闻资讯 (author: AI Base)
微信严打诱导分享,“自家兄弟”腾讯元宝AI红包被迫改版“口令化”

备受关注的腾讯旗下AI应用“腾讯元宝”因红包分享机制触发微信监管机制,引发行业热议。据实测发现,原有的直接分享链接领取红包的方式已被拦截,元宝官方已紧急将分享机制调整为“口令红包”模式,以规避违规风险。

此次风波源于微信派在今日上午发布的“关于第三方诱导分享行为的打击公告”。公告明确指出,针对春节期间集中爆发的过度营销和诱导分享行为,平台将进行严厉打击。经微信方面研判,腾讯元宝的红包活动链接被判定存在违规行为,并在微信生态内限制直接打开。

面对“自家兄弟”的刚正不阿,腾讯元宝方面迅速做出响应,表示正紧急优化调整分享机制,确保用户抢红包的体验不受影响。微信公关总监更是以幽默的态度在社交媒体回应称,平台规则一视同仁,用户体验永远位居第一,并配以“我发起疯来自己都打”的表情包,以此强调微信在维护生态健康上的决心。

腾讯元宝于2月1日启动了“春节10亿红包”大型活动,由于涉及巨额奖金及强社交属性,迅速形成了裂变式传播。然而,这种快速扩张的模式显然挑战了微信对诱导分享的底线。此次事件也再次向开发者警示,即便身处同一集团,在微信生态内活动仍需严格遵守平台运营规范。

via AI新闻资讯 (author: AI Base)
松下架构大调整:首设CAIO职位,全面加速AI战略落地

全球知名科技巨头松下正式对外宣布了一项重大的高管架构调整计划。为了在日益激烈的技术竞争中占据主动权,松下决定新设两个核心管理职位:首席人工智能官(CAIO)与解决方案营收官(SRO),此项任命将于今年 4 月 1 日正式生效。

在本次调整中,Akira Sakakibara 被任命为松下首位首席人工智能官(CAIO)。这一职位的设立,标志着松下将AI技术提升到了集团战略的新高度。根据官方说明,CAIO 的核心职责在于推动人工智能技术在企业内外部的深度融合。一方面,松下计划利用AI解决客户在实际场景中遇到的复杂问题;另一方面,公司将通过AI手段优化内部运营流程,力求显著提升整体办公与生产效率。

与此同时,Hirofumi Suzuki 被任命为解决方案营收官(SRO)。该职位将承担起统筹跨领域举措的重任,重点针对公司内部被列为优先发展的“解决方案领域”进行盈利结构优化。通过打破部门壁垒,SRO 将协调各方资源,确保公司在提供软硬件一体化服务时能够获得更强的盈利能力。

via AI新闻资讯 (author: AI Base)
英伟达黄仁勋驳斥人工智能将取代软件工具的担忧

英伟达首席执行官黄仁勋驳斥了人工智能将取代软件及相关工具的担忧,称该想法“不合逻辑”,此前全球软件股在周二遭遇大幅抛售。这场抛售潮部分源于人工智能开发商Anthropic上周推出新版聊天机器人,加剧了市场对人工智能引发数据及专业服务行业颠覆性变革的担忧;抛售潮在周三进一步蔓延,波及印度、日本和中国的软件股。

在思科系统公司于旧金山主办的一场人工智能大会上,黄仁勋表示,担忧人工智能会削弱软件企业重要性的想法存在误导,人工智能将持续依托现有软件,而非从零重构基础工具。

黄仁勋称:“当下有种观点认为软件行业的工具正走向衰落,且将被人工智能取代……这是世界上最不合逻辑的说法,时间会证明一切。”

“无论是人类、机器人还是通用人工智能机器人,都会选择使用工具而非重新发明工具,答案显然是前者……这也是人工智能领域最新突破聚焦工具应用的原因,毕竟这些工具的设计初衷本就是功能明确、易于使用。”

受全球软件股下跌拖累,印度信息技术出口企业股价周三重挫6.3%,科技服务企业印孚瑟斯位列跌幅榜前列,暴跌7.3%。

中国中证软件服务指数同样下跌3%;中国香港市场方面,软件企业金蝶国际软件集团股价暴跌逾13%。

日本市场中,人力资源服务商瑞可集团与野村综合研究所股价分别下跌9%和8%。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
📉 英伟达 CEO 黄仁勋驳斥 AI 取代软件工具论,全球软件股持续走低

英伟达首席执行官黄仁勋在思科主办的 AI 会议上表示,关于人工智能将取代软件及相关工具的担忧是“不合逻辑的”。他指出,AI 的最新突破在于对工具的使用,AI 将继续依赖现有软件而非从零开始重建基础工具。此次表态背景是全球软件股近期出现大幅下跌。受 Anthropic 上周发布更新版聊天机器人引发的行业颠覆担忧影响,抛售潮已波及亚洲市场。周三,印度 IT 出口商指数下跌 6.3%,其中 Infosys 跌幅达 7.3%;中国沪深 300 软件指数下跌 3%,金蝶国际在香港市场跌幅超过 13%;日本 Recruit Holdings 和野村综合研究所分别下跌 9% 和 8%。

(路透社)

via 茶馆 - Telegram Channel
支付宝集五福跨入“空间计算”时代:AI 眼镜扫福开启无手机新交互

2026年春节将至,传承多年的支付宝“集五福”活动迎来科技大爆发。今年,支付宝首次上线了 AI 眼镜扫福功能,标志着这项全民互动正式从手机屏幕跃迁至增强现实(AR)空间。

技术突破:注视即识别,语音即互动

不同于往年需要手持手机四处寻找“福”字,今年的集福体验更具科技感:

无手机操作:用户只需佩戴兼容的 AI 眼镜,目光注视任何地方的“福”字,眼镜即可自动识别。

智能交互:配合简单的语音指令,眼镜将自动完成扫码逻辑并将福卡发放至用户的支付宝账户。

社交进化:该功能深度整合了支付宝好友生态,支持通过语音直接将福卡分享给亲友,真正实现了“双手解放”。

架构支撑:GPASS 框架与 Agent 智能体

这一丝滑体验的背后,是蚂蚁集团核心技术的集中展现:

GPASS 技术框架:为大规模、高并发的视觉识别提供底层支撑,确保扫福过程低延迟且极其安全。

Agent 智能体架构:眼镜端的 AI 不再是简单的识别工具,而是化身为理解用户意图的“智能管家”,让服务“随行随动”。

玩法升级:内容更广,福利更厚

除了交互方式的变革,2026年集五福的内容也得到了全方位扩充:

识别范围更广:除了传统的“福”字,创意“马”字、各类热门游戏角色等均被纳入集福范畴。

奖品池翻倍:除了传统的现金红包,用户还有机会通过 AI 眼镜扫福获得实物 AI 眼镜等硬核科技好礼。

行业视角:构建“服务随行”新模式

支付宝相关负责人表示,AI 眼镜扫福只是第一步。随着智能穿戴设备的普及,支付宝正致力于构建一种全新的**“服务随行”**体验模式。在未来,无论是购物支付还是政务办事,用户或许只需一个眼神或一句口令,AI 就能在虚实结合的空间中即时响应。

via AI新闻资讯 (author: AI Base)
不被算法绑架:Firefox148官宣 AI 功能菜单,支持一键“彻底拔草”

面对 AI 席卷互联网的浪潮,Mozilla 基金会今日宣布,Firefox148 桌面版本将于 2月24日正式发布。不同于其他强制集成的浏览器,Firefox 负责人 Ajit Varma 强调,新版本将赋予用户前所未有的“AI 拒绝权”,以延续其隐私至上与用户掌控的核心承诺。

核心功能:深度集成与个性化选择

新版 Firefox 将人工智能无缝融入日常浏览场景,旨在打造更智能、直觉的体验。用户将获得以下 AI 驱动的功能:

● 智能侧边栏: 支持自由选择 ChatGPT、Microsoft Copilot 或 Google Gemini 作为内置助手。
● 效率工具: 自动生成标签页分组建议、链接预览摘要以及 PDF 替代文本。
● 浏览辅助: 实时网页语言翻译及多维度的 AI 搜索增强。

“一键关闭”:重申用户主权

针对用户对 AI 侵入感和隐私泄露的担忧,Mozilla 在设置中新增了专门的 AI 管理菜单

● 透明且可选: 用户可以针对具体功能进行精细化调整,或直接通过“一键开关”彻底禁用所有 AI 选项。
● 隐私至上: Mozilla AI 产品负责人黄咲莉(Sali Huang)重申,Firefox 的 AI 开发始终遵循严格的隐私保护原则,确保效率提升不以牺牲个人数据为代价。

市场定位:2亿用户的非营利性选择

作为目前规模最大的非营利性浏览器,Firefox 拥有约2亿月活跃用户。Varma 表示,虽然 Safari 和 Edge 均已推出类似功能,但 Firefox 的差异化在于“倾听社区声音”。公司目前专注于完善桌面端的用户反馈,未来再逐步扩展至移动平台。

急于尝鲜的开发者和硬核用户可以通过 Firefox Nightly(开发版)提前体验这些 AI 功能,但普通用户建议等待2月下旬的正式更新。

via AI新闻资讯 (author: AI Base)
AI 赋能新时代:中国电信推动千行百业数字化转型!

在近期举行的国务院新闻发布会上,国资委副主任庞骁刚表示,国家将进一步加大 “AI+” 专项行动的推进力度,旨在提升中央企业在智能计算基础设施和人工智能产业中的角色。随着人工智能技术的发展,国家已在多个领域如政务和工业中应用 AI 技术,有效提升了工作效率与服务质量。

作为推动这一战略的重要参与者,中国电信积极响应国家号召,致力于与各行业领先企业展开深入合作,创建超过一千个 AI 应用场景。这些应用场景涵盖了从城市管理到工业生产等多个方面,为各行业带来了实实在在的效益。

此外,中国电信与其他三大运营商合作,共同建立了 “万卡集群” 项目,为大型模型训练提供强大的算力支持。这一举措不仅提高了数据处理的能力,也为后续的 AI 技术发展奠定了坚实的基础。同时,中央企业也在不断推动 AI 技术的创新,打造更加高效的算力服务平台,实现算力的高效流通,从而更好地服务于社会各界的需求。

庞骁刚强调,国家在 “AI+” 建设方面的重视,不仅是为了推动科技进步,更是希望通过技术创新为经济发展注入新的动力。未来,随着 AI 技术的持续发展,预计将有更多行业和企业受益,真正实现数字经济的跨越式增长。

这一系列举措彰显了中国电信在 AI 创新与应用方面的决心与责任,将为各行业的转型升级提供强有力的支持。

via AI新闻资讯 (author: AI Base)
2025 全球中文大模型榜单出炉:海外巨头包揽前三,国产大模型在细分领域超车

SuperCLUE正式发布了“2025年度中文大模型基准测评报告”,这场汇聚了23个国内外顶尖模型的“全明星赛”,再次揭示了全球AI战局的新动向。测评覆盖了数学推理、代码生成及科学推理等六大核心维度,直观展示了当前中文语境下各大模型的真实“战力”。

从综合排名来看,海外闭源模型依然展现出强大的统治力。Anthropic旗下的Claude-Opus-4.5-Reasoning凭借68.25的高分问鼎榜首,谷歌的Gemini-3-Pro-Preview与OpenAI的GPT-5.2(high)紧随其后,分别夺得亚军和季军。这三大巨头构成的“第一梯队”,在逻辑严密性和综合理解力上依然保持着微弱的领先优势。

然而,国产大模型的表现堪称惊喜,正以前所未有的速度缩小差距。国内开源界的“领头羊”Kimi-K2.5-Thinking与闭源代表Qwen3-Max-Thinking分别杀入全球前十,位列第四和第六。值得振奋的是,在垂直赛道上,国产模型已经实现了“局部反超”:Kimi在代码生成任务中勇夺全球第一,而Qwen3则在数学推理上与谷歌并列世界冠军。

纵观整体格局,海内外呈现出截然不同的竞争态势。闭源领域目前是“海外领跑、国产追赶”;而在开源领域,国产模型则占据了绝对的主导地位,国内开源Top5的实力已大幅领先海外同类模型。这种“开闭并进”的局面,预示着中文AI生态正进入一个高质量发展的爆发期。

划重点:

🏆 海外巨头领跑: Claude-Opus-4.5-Reasoning以最高分位居全球中文大模型战力榜首,海外闭源模型依然包揽前三名。
🚀 国产局部超越: Kimi-K2.5-Thinking在代码生成领域夺冠,Qwen3-Max-Thinking则在数学推理上与谷歌Gemini并列全球第一。
📊 开源国产主导: 在开源模型阵营中,国产模型表现远超海外竞争对手,展现了国内大模型生态在开放协作方面的独特优势。

via AI新闻资讯 (author: AI Base)
🇨🇳 中国开源AI模型主导全球市场引发美国投资者关注

越来越多美国投资者关注到中国公司在开源AI领域的领先地位。DeepSeek、Moonshot AI和Zai等中国实验室正占据市场主导。Artificial Analysis排行榜显示,目前全球排名前六的开源模型均由中国公司开发。数据显示,中国开源模型的使用率从2024年底的1.2%快速攀升至12月的近30%。目前,多数选择开源模型的AI初创公司已转向使用中国开发的模型。

(科技圈)

via 茶馆 - Telegram Channel
昆仑天工发布“Skywork桌面版”:你的Windows电脑现在可以雇佣“AI员工”了

昆仑天工向全球正式发布了其重磅桌面端应用“天工Skywork桌面版(Skywork Desktop)”。这款产品的问世,标志着AI Agent正式从网页端的“被动对话”进化到了系统级的“主动协作”,为全球Windows用户提供了一个真正能干活的“OS级同事”。

与传统AI助手不同,Skywork桌面版主打本地化执行,用户无需将敏感文件上传至云端即可完成处理。它能直接读取并理解电脑本地的海量文件,无论是文档、表格、PPT,还是图片和视频,都能在统一的语义下被归类和执行任务。这意味着AI不再是单纯地“等喂料”,而是能深度理解整个项目的上下文,直接深入办公场景的“最后一公里”。

为了让用户拥有更强的自主权,Skywork桌面版首次实现了“模型选择自由”。它不仅支持Claude4.5系列模型,还引入了谷歌的Gemini3Pro。用户可以根据任务需求手动切换,也可以开启“auto”模式让系统智能调配。此外,该应用内置了超过100个精选技能(Skills),涵盖了从Office办公到音视频生成的全方位需求。

安全性方面,Skywork桌面版通过本地虚拟机隔离环境运行,确保数据“不跑路”,极大地降低了泄密风险。昆仑天工表示,这款产品的发布意味着“操作系统Agent(OS Agent)”时代的正式开启,将彻底扭转AI只能处理简单任务的局限,让每一台电脑都能拥有专属的高阶AI员工。

划重点:

🖥️ Windows原生深度支持: 优先覆盖Windows系统,能够直接处理本地历史文件和复杂项目场景,被誉为“Windows打工人的福音”。
🤖 双旗舰模型自由切换: 同时集成了Claude4.5与Gemini3Pro模型,并支持智能自动推荐,让AI任务处理的速度与质量大幅提升。
🔒 本地隔离安全可靠: 任务均在本地虚拟机环境中完成,无需上传文件到云端,从物理层面保障了企业与个人数据的安全性。

via AI新闻资讯 (author: AI Base)
蚂蚁阿福升级“长辈模式”:超大字体,还可直接打电话咨询

2月4日消息,蚂蚁阿福App近日完成重要升级,上线专为老年用户设计的“长辈模式”。长辈模式下,字体和图标更大,默认语音对话交互,还可直接与阿福打电话咨询健康问题。加上阿福上线以来便支持粤语、闽南话等十几种方言提问,让老人们和阿福的交流更加顺畅。

与此同时,升级后的阿福App还支持自定义“阿福”形象,目前提供三种数字人风格供选择,未来还将上线更多形象。

阿福“长辈模式”:字大,还可打电话咨询

作为国内最大的健康AI,蚂蚁阿福已成为许多老年用户的健康伙伴。数据显示,蚂蚁阿福的用户中,50后和60后用户占比20%。

为进一步提升老年用户的使用体验,蚂蚁阿福App升级“长辈模式”,用户在阿福首页对话框中直接输入“长辈模式”,即可一键切换。

开启“长辈模式”后,阿福App的界面将显示超大字体和图标,更清晰醒目。对话框默认语音输入模式,阿福的回复也将以语音形式清晰播报。

此外,阿福还加强了对方言的识别能力,支持粤语、闽南话等十多种地方语言提问。来自广东的陈女士教爸妈学会了阿福App,她说爸妈现在跟阿福提问都直接用粤语提问,非常方便。

“阿福”形象支持自定义了

蚂蚁阿福此次升级另一亮点,是支持用户自定义“阿福”的数字人视觉形象。首批上线三种数字人风格,用户点击首页的“阿福”形象即可选择并切换,点击“点我试试”还可直接与阿福电话沟通咨询。该功能现已陆续更新,即将全量上线。

图:“阿福”App支持自定义阿福形象

阿福产品负责人表示,阿福定位于AI医生朋友,不同用户对于医生朋友的形象需求是不一样的,未来还会上线更多数字人形象供用户选择。

蚂蚁阿福去年上线以来,已迅速成为国内第一大健康类AI应用,单日处理超1000万个健康疑问。除健康问答外,阿福还支持拍照解读报告、绑定智能设备、管理健康档案等服务。在就医环节,阿福提供医保支付、AI挂号、在线问诊等便捷服务。

via AI新闻资讯 (author: AI Base)
全球中文大模型竞赛!海外强者包揽前三,国产崭露头角!

近日,SuperCLUE 发布了2025年度中文大模型基准测评报告,吸引了众多科技爱好者的目光。在此次评测中,共有23个国内外大模型参与角逐,涵盖数学推理、科学推理和代码生成等六大核心维度。评测结果显示,海外闭源模型依旧占据领先地位,尤其是 Anthropic 的 Claude-Opus-4.5-Reasoning,以68.25分高居榜首,成为了此次评测的佼佼者。

紧随其后的是谷歌的 Gemini-3-Pro-Preview 和 OpenAI 的 GPT-5.2(high),分别以65.59分和64.32分位列第二和第三,海外巨头们的实力依然令人瞩目。不过,值得一提的是,国产大模型在此次评测中也展现出惊人的实力,特别是开源模型 Kimi-K2.5-Thinking 和闭源模型 Qwen3-Max-Thinking,分别以61.50分和60.61分荣获第四和第六名的好成绩。

在细分领域中,国产模型表现尤为突出。Kimi-K2.5-Thinking 在代码生成任务中以53.33分的优异成绩夺得了冠军,而 Qwen3-Max-Thinking 在数学推理任务中与 Gemini-3-Pro-Preview 并列,以80.87分的成绩荣登榜首。这些成绩表明,国产模型正逐步从 “跟跑” 向 “并跑” 迈进,展现出强大的追赶能力。

从整体来看,海外闭源模型仍然领先于国产模型,但国产开源模型却表现出色,在 Top5中占据了绝对优势,显示出国产开源模型的强劲实力与发展潜力。随着科技的不断进步和国内研发的加速,未来的中文大模型领域或将迎来更多惊喜与挑战。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]