ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

21:41 · 2026年2月3日 · 周二

↩️ OpenAI优先发展ChatGPT引发高级研究人员离职潮

科技圈🎗在花频道📮:

OpenAI联合创始人John Schulman加入Anthropic OpenAI的联合创始人John Schulman宣布离职，并加入AI竞争对手Anthropic。他是OpenAI的第三位核心人物，此前参与了许多重要项目。Anthropic是一家由前OpenAI高管创立的人工智能公司，专注于开发以安全为核心的AI技术。Schulman的加入被认为将加强Anthropic的技术能力，并在AI行业内引起广泛关注。 Bloomberg ☘️ 关注频道 @ZaiHuaPd 📮 投稿爆料 @ZaiHuabot

OpenAI优先发展ChatGPT引发高级研究人员离职潮

OpenAI正将资源重点从长期研究转向ChatGPT等大语言模型的改进，相关调整引发多名高级研究人员近期离职。多名现任及前任员工透露，在来自Google和Anthropic的竞争压力下，OpenAI正在重新分配内部资源。

报道还称，OpenAI首席执行官Sam Altman去年12月在谷歌Gemini 3模型发布后，向内部发出“红色警戒”提示。

金融时报

🍀在花频道 🍵茶馆聊天 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel

21:41 · 2026年2月3日 · 周二

法国司法部门搜查X平台办公室并传唤马斯克

当地时间2月3日，法国巴黎检察院表示，当天已对美国企业家马斯克旗下社交媒体平台 X 位于法国的办公场所展开搜查。据悉，此次行动属于巴黎检察院网络犯罪打击部门于2025年 1月立案调查的一部分，调查由法国国家宪兵网络犯罪部门负责实施，并有欧洲刑警组织在场配合。与此同时，法国司法部门已向 X 平台负责人发出传唤通知。根据检方通报，X 平台实际负责人埃隆·马斯克被要求于2026年4月20日在巴黎接受“自由听证”，就相关指控作出说明。此外，多名 X 平台员工也被传唤，将于2026年4月20日至24日期间以证人身份接受质询。

—— 新京报、彭博社

via 风向旗参考快讯 - Telegram Channel

21:33 · 2026年2月3日 · 周二

路透调查：马斯克AI仍在生成不雅图像，警告也不行

2月3日，路透社的调查发现，马斯克旗下社交平台X的旗舰AI聊天机器人Grok仍在生成人物的性化图像，即便在用户明确警告称当事人不同意的情况下也是如此。在X宣布对Grok的公开输出实施新的限制后，路透社的九名记者向该聊天机器人输入了一系列提示词，以测试它是否以及在何种情况下会生成未经同意的性化图像。

Grok仍在生成不雅图像

路透社记者发现，尽管Grok在X上的公开账号已不再像此前那样大量生成性化图像，但在接到相关提示词时仍会继续生成此类内容，甚至在被明确告知图像中的人物处于弱势地位或会因这些图片而受到羞辱之后，依然如此。

在首批提示词测试中，Grok对55个提示语中的45个生成了性化图像。在这45次中，有31次记者明确警告过图像中的人物极易受到伤害，有17次是直接告知这些图像将被用于羞辱当事人，但是Grok依然生成了相关图像。

在第二轮包含43个提示词的测试中，Grok有29次仍生成了性化图像。目前尚不确定比例下降是由于模型调整、政策变更还是随机因素所致。

截至发稿，X和xAI尚未就此置评。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：凤凰网科技)

21:10 · 2026年2月3日 · 周二

西班牙拟禁止16岁以下青少年使用社媒

西班牙首相佩德罗·桑切斯表示，西班牙将阻止儿童使用包括Instagram和TikTok在内的社交媒体平台，这是欧洲新一轮监管数字平台的举措。桑切斯周二在阿拉伯联合酋长国的一场峰会上表示，马德里希望限制16岁以下人群使用这些平台。为执行该禁令，政府将寻求命令平台建立年龄验证方法。桑切斯说道：“社交媒体已成为一个失败的国家，在那里法律被忽视，犯罪被容忍，虚假信息比真相更有价值，且半数用户遭受仇恨攻击。”据西班牙首相表示，该西班牙法律将使高管对Grok、TikTok 和 Instagram等平台上的违规行为承担法律责任。他补充说，CEO若未删除仇恨性或非法内容，将面临刑事责任。

—— 彭博社

via 风向旗参考快讯 - Telegram Channel

18:55 · 2026年2月3日 · 周二

⚖️ 法国检方扩大对 X 平台的调查并传唤埃隆·马斯克

法国巴黎检察官于2月3日宣布，已扩大对埃隆·马斯克旗下社交媒体平台 X 的调查范围，并传唤马斯克于今年4月接受质询。该调查始于2025年1月，最初聚焦于算法滥用和欺诈性数据提取，现因涉及 AI 聊天机器人 Grok 的相关投诉而进一步升级。目前检方调查的潜在罪名涵盖多个领域，包括共谋持有及有组织传播未成年人色情图像、利用深度伪造技术进行性诽谤、否认反人类罪（如否认大屠杀），以及有组织地欺诈性提取数据、篡改自动化系统运行和经营非法在线平台。

(路透社)

via 茶馆 - Telegram Channel

18:09 · 2026年2月3日 · 周二

大模型春节更新预告：智谱 GLM-5 与 MiniMax M2.2 即将发布

近日，有消息透露，总部位于北京的智谱 AI 与上海的 MiniMax 正计划在春节前后分别推出新一代 AI 模型，引发了业内的广泛关注。

智谱 AI 的 GLM-5 模型预计将在 2 月 15 日农历新年开始前一周正式发布。根据内部消息，这款新模型在创意写作、编程、推理及智能体能力等领域将实现突破性进展，极有可能重新定义 AI 的应用方式。GLM-5 的推出被寄予厚望，业界期待它能够在多个领域带来实质性提升，尤其是在智能写作和代码生成方面。

与此同时，MiniMax 也不甘示弱，将于春节前发布其 M2.2 版本。这是其前一代模型 M2.1 的升级版，着重增强编程能力，预计将为开发者带来更加高效的工具和解决方案。行业分析师认为，MiniMax M2.2 将成为程序员手中的 “秘密武器”，助力他们更快地完成复杂任务。

而另一边，DeepSeek 可能仅在春节前后对其 V3 系列模型进行小幅更新，未来的旗舰模型则被预告将会是一款万亿参数级别的 AI，尽管由于训练时间较长，发布时间有所延后。此消息无疑增加了市场的期待感，尤其是在大型语言模型竞争日益激烈的背景下。

除了这几家公司的新动态，字节跳动和阿里巴巴也计划在 2026 年春节前后推出各自的新一代 AI 模型，进一步加剧市场竞争。字节跳动预计推出 Doubao 2.0（大型语言模型）、Seedream 5.0（图像生成模型）和 SeedDance 2.0（视频生成模型），而阿里巴巴将发布主攻推理与复杂任务能力的 Qwen 3.5。这些新模型的推出，将涵盖文本、图像和视频的多模态生成能力，展现出 AI 产品线的不断扩展。

总之，在春节的脚步声中，AI 行业将迎来一波新的发布潮，业界对未来的技术革新充满期待。

via AI新闻资讯 (author: AI Base)

17:37 · 2026年2月3日 · 周二

编程界“地震”级更新!Claude5核心细节遭泄露:中端定价却能“吊打”旗舰?

全球开发者社区正因一场“史诗级”的泄露而沸腾。多方证据显示，Anthropic 的新一代编程大模型 Claude Sonnet5（代号 Fennec）已现身谷歌云基础设施，并有望于2026年2月初正式发布。这款被业内戏称为“把整个开发团队塞进模型里”的巨作，正以极其恐怖的性能指标向市场宣告编程 AI 的巅峰时刻已经到来。

此次泄露源于开发者在调用 API 时意外触发的404错误日志，揭示了该模型已完成部署。初步测评数据显示，Sonnet5在处理复杂 UI 渲染和结构化视觉生成任务时表现惊人。更令竞争对手不安的是，虽然其定位为中端的“Sonnet”系列，但在多项内部基准测试中，其整体性能已全面超越了自家的顶级旗舰 Claude Opus4.5。

Sonnet5的核心杀手锏在于其强大的“蜂群模式（Agent Swarm）”。在 Dev Team 开发模式下，该模型能根据需求自动拆分任务，并在后台生成多个子智能体(如前端构建、后端开发、QA 测试等)进行并行协作。这意味着它不再只是一个辅助写代码的插件，而是一个可以自主组织、自我迭代、无需休假的数字化研发团队。

为了彻底解决开发者对大模型“又贵又慢”的痛点，Sonnet5依托谷歌 TPU 进行了深度优化。其推理成本大幅下降，定价仅为 Opus4.5的50%，同时提供高达100万 token 的上下文窗口。面对 OpenAI 即将发布的 Codex 全家桶，Anthropic 此举显然带有“正面硬刚”的杀气，软件工程的生产力范式或将在近日迎来彻底重构。

划重点:

● 🚀 越级挑战:代号 Fennec 的 Sonnet5性能超越旗舰级 Opus4.5，且在 SWE-Bench 编程基准测试中得分突破80.9%。
● 🤖 蜂群协作:首创“自动开发团队”模式，能自主生成并调度多个子智能体并行工作，实现从需求到功能的完整交付。
● 💸 极致性价比:定价直接腰斩50%，并提供100万 token 超长上下文，运行速度更快且延迟更低。

via AI新闻资讯 (author: AI Base)

17:29 · 2026年2月3日 · 周二

Claude 5 震撼曝光：Anthropic 祭出“代号 Fennec”，编程模型格局将变

根据近期泄露的行业情报，Anthropic 的下一代大模型 Claude Sonnet5（内部代号 Fennec）已部署于谷歌基础设施中，发布在即。这款被视为“史上最强编程模型”的新品，不仅在性能上实现越级突破，更通过价格战和全新的“蜂群”开发模式，直击当前编程 AI 的所有痛点。

核心亮点:性能吊打旗舰，价格直降五成

Claude Sonnet5的出现并非简单的迭代，而是一次降维打击:

越级性能:尽管定位为中端 Sonnet 系列，但在多项内部基准测试中，其整体表现已超越了现有的旗舰级 Claude Opus4.5。

极致定价:由于直接在谷歌 TPU 上进行优化训练，其推理成本大幅下降，定价预计仅为 Opus4.5的50%。

百万长上下文:拥有100万 token 的超大上下文窗口，能够一次性吞下整个项目代码库，从全局视角理解并交付代码，彻底解决“遗留系统”和“屎山代码”的重构难题。

技术突破:SWE-Bench 跑分突破80%

在衡量 AI 编程能力的权威榜单 SWE-Bench 上，Claude Sonnet5取得了超过80.9% 的惊人成绩，远超目前市面上所有编程模型（此前的最高纪录为74.4%）。这意味着它能独立完成从修 Bug、跑 CI 到找回归问题的软件工程师全量日常工作。

“蜂群”模式:一个不请假的 AI 开发团队

Claude Sonnet5最具颠覆性的功能是 Dev Team（开发团队模式），即所谓的“蜂群”架构(Agent Swarm):

自我组织:只需输入一个需求，模型会自动生成总指挥、前端开发、后端开发、QA 测试等多个子智能体。

并行协作:这些智能体能并行工作、互相校验，甚至能根据任务需要“自我增殖”产生新的专项智能体，最终输出完整可运行的功能模块。

工业级产出:任务结束后，系统能自动生成项目总结与执行报告，其产出质量已达到工程管理级别。

行业影响:正面硬刚 OpenAI

Anthropic选择在此时泄露 Sonnet5，用意在于正面阻击 OpenAI 即将发布的 Codex 全家桶。

市场地位:截至2025年 Q4，Anthropic 在企业市场的占有率已达40%，领跑行业。

商业闭环:Claude Code 的年化收入仅用半年就突破了10亿美元，显示出开发者对高效编程工具的巨大付费意愿。

via AI新闻资讯 (author: AI Base)

17:18 · 2026年2月3日 · 周二

微信小程序教育平台免费向师生开放，AI 教学项目超 17 万

近日，微信官方公布了“微信小程序教育平台”的最新成绩单。数据显示，截至目前，全球已有超过 5000 所学校深度接入该平台，共同探索 AI 课程的融合教学，师生们已累计在平台上创建了超过 17 万个小程序项目。

作为一款专为教学设计的工具，微信小程序教育平台已经历了五年的持续迭代。该平台致力于为师生提供免费的“学、用、教”全流程能力，显著降低了 AI 创作的门槛。在创作工具端，平台提供功能完备的在线代码编辑器，支持师生实时预览并一键发布作品。而在教学环节，平台不仅提供了贴合信息科技课标的官方课程库，还引入了 AI 老师进行辅助教学。

值得关注的是，平台集成的 AI 教学助手已支持自然语言创作和“文生图”等前沿应用。这意味着学生可以通过简单的文字指令进行编程尝试，极大地激发了青少年的创造力。以广东廉江安铺中学为例，该校已在七年级至高三全线铺开 AI 相关课程，通过小程序赋能，成功开展了“人工智能+传统文化”等一系列跨学科项目式学习。

微信团队表示，未来将继续加大在 AI 教育领域的投入，并计划邀请更多教育专家和教师加入，共同构建更加丰富的智慧教学生态。

划重点：

● 🚀 规模化覆盖：全球超 5000 所学校接入，师生累计创建小程序项目已突破 17 万个。
● 🛠️ 全流程赋能：提供从代码编辑、云端存储到 AI 助手辅助创作的免费“学用教”一体化工具。
● 🎓 深度融合：成功在多所中学实现全学段 AI 课程普及，通过“自然语言创作”降低编程学习门槛。

via AI新闻资讯 (author: AI Base)

17:16 · 2026年2月3日 · 周二

#cloudflare #AI #agent

🦞 Moltworker - 在 Cloudflare Workers 上运行 OpenClaw

Moltworker 是一个基于 Cloudflare 平台的自托管个人 AI 代理。每个月仅需＄5。

OpenClaw 是最近很火的一个 Agent，刚出炉的时候叫 Clawdbot，后面改名字叫 Moltbot ，现在则是叫 OpenClaw。[2026.02.02]

它能迅速走红的原因是用户开始对只会聊天的 AI 有些厌倦了，而 OpenClaw 与传统的 AI 不同的是，它可以帮你操控你的系统。

因而它也需要更高的权限，所以运行在自己的设备显得有点不太安全，Moltworker 则出现的刚刚好。

↗️ 相关阅读

▫️OpenClaw 官方中文文档
▫️开源页面

📮投稿 📢频道 💬群聊 🔎索引

via 极客分享 - Telegram Channel

16:34 · 2026年2月3日 · 周二

🤖 图灵奖得主 Yann LeCun 公开表态使用 Google Gemini

图灵奖得主、Meta 前首席 AI 科学家 Yann LeCun 近日在 LinkedIn 平台公开表示其正在使用 Google Gemini。LeCun 长期对自回归大型语言模型持批评态度，他于 2025 年 11 月离开 Meta 并创立了 Advanced Machine Intelligence Labs。他在社交动态中明确表态“我为 Gemini 代言”，展现了对该 AI 产品的偏好。

(科技圈)

via 茶馆 - Telegram Channel

16:32 · 2026年2月3日 · 周二

Meta 前首席 AI 科学家 LeCun 在领英公开表示偏好 Google Gemini

Yann LeCun于LinkedIn评论中以“I use Gemini”公开表态使用Google Gemini。他是图灵奖得主，曾任Meta首席AI科学家、长期批评自回归大型语言模型，2025年11月离开Meta创立Advanced Machine Intelligence Labs。

PPC

我是（前）Meta 杨立昆，我为 Gemini 代言。

🍀在花频道🍵茶馆聊天📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel

16:23 · 2026年2月3日 · 周二

智能交通新时代：大模型网关如何改变 AI 应用的格局

随着这些技术的普及，AI 相关的 API 流量激增，催生了 “智能交通枢纽”—— 大模型网关。这个新兴的技术解决方案旨在高效管理 AI 流量，确保企业能够顺利使用各种 AI 模型。

在现实业务中，企业面临着如何有效接入和管理多种 AI 模型的挑战。这些模型可能来自于不同的提供商，API 接口和数据格式各异，如果各部门单独搭建接入能力，势必导致资源浪费和技术碎片化。因此，企业需要一个集中统一的解决方案来管理这些 AI 模型。

大模型网关正是为此而生。它不仅连接业务与 AI 基础设施，还能够提供针对 AI 请求的优化管理能力。与传统的 API 网关不同，大模型网关专注于处理长时与流式响应、复杂的输入输出，以及高资源消耗的 AI 工作负载。它能够有效管理模型的使用成本、保障数据安全、提升服务的稳定性。

以得物为例，该平台在引入多种 AI 模型的过程中，遇到了模型调用成本激增、数据安全隐患以及服务稳定性等一系列挑战。为了解决这些问题，得物决定自建大模型网关，以实现资源的高效利用和成本的严格控制。

在实施过程中，得物采取了六项策略，首先是建立一个信息丰富的 “模型市场”，方便业务团队选择合适的 AI 模型。其次，构建统一的访问 API，让不同业务线可以轻松接入 AI 服务。此外，得物还推出了全流程的成本管控体系，通过优化模型使用，显著降低了运营成本。

大模型网关的出现，标志着企业在 AI 应用管理上的新突破。通过提升接入效率、保障数据安全和优化成本，企业能够更灵活地应对市场需求，实现业务的可持续发展。

via AI新闻资讯 (author: AI Base)

16:23 · 2026年2月3日 · 周二

Claude 5史诗级泄露史上最强编程模型核心秘密曝光

via cnBeta.COM - 中文业界资讯站 (author: 稿源：新智元)

Telegraph

Claude 5史诗级泄露史上最强编程模型核心秘密曝光

Anthropic的新模型要来了！代号Fennec的Claude Sonnet 5马上要发布，性能吊打市面上所有编程大模型，价格还砍掉50%，还能比肩一整个人类开发团队，可以说达到编程领域的巅峰。Claude Sonnet 5，马上就要发布了！多条信息显示，Claude Sonnet 5（代号Fennec）已经存在于谷歌基础设施中，在性能上领先谷歌的「Snow Bunny」整整一代。它有100万token上下文窗口，定价比Opus 4.5便宜50%，将直接解决开发者对Opus「太慢、太贵」的核心不满。…

16:13 · 2026年2月3日 · 周二

Google斥巨资力图在人工智能能源竞赛中占据领先地位

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球市场播报)

Telegraph

Google斥巨资力图在人工智能能源竞赛中占据领先地位

Google计划斥资 47.5 亿美元，以解决人工智能竞赛中一个棘手的难题，为规模日益庞大的数据中心舰队找到足够的电力供应。该公司即将完成对风电和太阳能开发商Intersect的收购，此举将使其成为唯一一家拥有电力公司的科技巨头。这可能使其在竞争对手中占据显著优势，因为电力管理部门更青睐那些准备自建发电设施的科技公司，而特朗普政府也正施压要求他们避免将电力成本转嫁给消费者。此次收购是Google一系列战略布局中的最新一步，旨在构建一套从源头到应用的完整策略，以获取海量电力资源。在竞争对手中，Googl…

15:33 · 2026年2月3日 · 周二

拒绝“毁经典”!国家广电总局出手:抖音小红书下架数千条 AI 魔改视频

随着人工智能生成内容（AIGC）的泛滥，针对影视经典及英雄模范人物的恶意篡改行为正面临严厉监管。记者从国家广播电视总局获悉，自2026年1月1日起，全国范围内开展了为期一个月的“AI 魔改”视频专项治理行动。

核心整治:守护经典与英模形象

本次专项行动将重点指向了对社会主流价值及文化遗产的保护。治理范围包括但不限于:

● 古典名著: 严禁对“四大名著”等经典电视剧作品进行扭曲原意的 AI 篡改。
● 严肃题材: 重点整治涉及历史题材、革命题材视频的违规“魔改”。
● 人物尊严: 坚决打击针对英模人物等影视作品内容的 AI 二次创作乱象。

平台战报:数千条违规视频被清理

近日，多家网络视听平台相继公布了本次专项治理的最终处理结果，通过技术识别与人工审核双重手段清理违规内容:

● 抖音: 专项治理期间，平台累计处置涉“AI 魔改”违规视频 6713条。
● 小红书: 累计清理处置违规内容 1394条，并对 61个 违规账号进行了封禁或处罚。

未来展望:常态化监管已成定局

国家广电总局表示，专项行动虽暂告一段落，但治理不会止步。后续各平台将建立常态化治理机制，严防“AI 魔改”视频回潮，确保网络视听空间清朗有序，尊重原创版权与历史事实。

via AI新闻资讯 (author: AI Base)

15:17 · 2026年2月3日 · 周二

前 OpenAI 专家发出警示:AI 不会“吃一堑长一智”，AGI面临关键瓶颈

尽管当前的AI大模型在逻辑推理和任务处理上表现惊人，但一个长期被忽视的技术缺陷可能正成为通往通用人工智能（AGI）道路上的巨大障碍。近日，曾参与 OpenAI 推理模型 o1和 o3开发的核心研究员 Jerry Tworek 在受访时直言:目前的AI模型根本无法从错误中汲取教训。

Tworek 指出，当现有的AI模型在处理问题失败时，开发者往往会陷入一种无力感，因为目前还缺乏有效的机制让模型根据失败经验来更新其内在的知识体系或信念。他形容当前的AI训练过程本质上是“极其脆弱的”，一旦遇到训练模式之外的新挑战，模型就很容易陷入“推理崩溃”的困境，这与人类那种具备自我稳定和自我修复能力的鲁棒性学习方式形成了鲜明对比。

正是为了攻克这一难题，Tworek 已于近期离开 OpenAI，专注于寻找让AI能够自主解决困难、摆脱困境的技术路径。他强调，如果一个模型不能在面对挫折时自我进化，那么它就很难被称为真正的 AGI。在他看来，智能的本质应该像生命一样“总能找到出路”，而当前的AI显然还远未达到这种境界。

划重点:

● 🧠 核心缺陷:前 OpenAI 研究员 Jerry Tworek 指出当前AI模型缺乏从失败中学习的机制，无法像人类一样通过纠错来更新内部知识。
● 🚧 AGI障碍:模型在处理未知模式时的“脆弱性”和容易“卡死”的状态，被认为是实现通用人工智能（AGI）的主要技术壁垒。
● 🛠️ 专家动向:为解决这一根本性难题，o1系列模型的幕后功臣 Tworek 已离职并投身于研发能自主摆脱困境的新一代AI架构。

via AI新闻资讯 (author: AI Base)

15:17 · 2026年2月3日 · 周二

AI 学霸遭遇重创！GPT-4o 专家考试仅得 2.7 分

最近一项名为 “人类终极考试”（HLE）的测试结果让我们重新审视 AI 的真实能力。根据《自然》杂志的报道，GPT-4o 在这 2500 道由全球专家出题的测试中，仅获得了可怜的 2.7 分（满分 100 分），而表现最好的 AI 模型也仅得 8 分。这一结果让人质疑，AI 的强大究竟是实打实的实力，还是表面的繁荣？

传统的 AI 测试越来越无法反映真实能力，主要原因有两个。一是 “基准饱和”，即 AI 系统已经将常规测试题目背得滚瓜烂熟，得分的高低与真正的理解能力无关；二是 “答案作弊”，很多测试的答案可以直接在网上找到，使得 AI 看似答对问题，但实际上只是依赖于检索和记忆，而非真正的推理能力。

为了解决这些问题，HLE 的设计者们集结了来自 50 个国家的近 1000 名专家，确保每道题目都要求深层的专业知识，难度大幅提升。HLE 的题目不仅覆盖了数学、物理、化学等多个领域，还设定了严格的审核流程，确保题目难度足够，难以被 AI 轻易破解。比如数学题需要深入逻辑推理，化学题涉及复杂的反应机制，绝不是简单的检索就能得到答案。

测试结果一目了然：GPT-4o 仅得 2.7 分，Claude 3.5 Sonnet 和 Gemini 1.5 Pro 也只分别获得 4.1% 和 4.6% 的准确率，表现最好的 o1 也仅得 8%。这些数据清楚地表明，即便是最新一代的 AI，在面对真正需要深厚专业知识的问题时，依然显得无能为力。

通过 HLE 的测试，我们可以看到 AI 的真实能力与传统基准测试中的高分形成了鲜明对比。这也促使我们重新思考，AI 是否真的如我们想象中那样聪明，还是只是一种表象的成功。

via AI新闻资讯 (author: AI Base)

15:01 · 2026年2月3日 · 周二

商业前哨:OpenAI 战略重心转向 ChatGPT 引发核心高管离职潮

via AI新闻资讯 (author: AI Base)

Telegraph

商业前哨:OpenAI 战略重心转向 ChatGPT 引发核心高管离职潮

据《金融时报》报道，曾在人工智能领域保持绝对领先地位的 OpenAI，正面临自 ChatGPT 发布以来最剧烈的内部动荡。据多位知情人士透露，这家估值已达5000亿美元的科技巨头正经历一场从“纯粹研究”向“产品导向”的痛苦转型，这一调整直接导致了多位资深高管和核心研究员的流失。

15:01 · 2026年2月3日 · 周二

机构：用户对AI应用热情高涨 AIGC APP月活用户净增超2亿

根据 QuestMobile 最新发布的数据，截止到 2025 年 12 月，中国的月活跃用户总数已经突破了惊人的 12.76 亿人，用户的月均使用时长达到 186.2 小时，比去年增长了 8.4%。这一数据的背后，反映出用户对于移动互联网服务的热情日益高涨，尤其是在人工智能技术不断进步的推动下。

数据显示，尤其在 12 月份，AIGC（人工智能生成内容）应用行业表现尤为亮眼，月活跃用户规模净增超过 2 亿，年同比增速高达 150.4%。这标志着 AIGC 应用正在快速占领用户的注意力，成为互联网应用的新宠。AI 技术的红利正在释放，许多用户通过这些应用获得了更高效、更智能的服务体验。

此外，AI 应用插件也表现出强劲的增长势头。其月活跃用户数量已达到 6.96 亿，同比增速达 37.8%。这意味着，越来越多的用户开始主动使用这些智能工具来提升日常生活和工作的便利性。这种趋势不仅反映出用户对 AI 技术的接受程度提高，也说明了 AI 在日常应用场景中的重要性。

随着 AI 技术的发展，用户对智能内容生成和应用的需求正在不断上升，未来这一领域有望继续保持快速增长的势头。无论是在娱乐、社交还是工作中，AIGC 应用都在不断塑造着我们的生活方式，让我们对未来的科技充满期待。

via AI新闻资讯 (author: AI Base)

Before

After

Home