https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
编程界“地震”级更新!Claude5核心细节遭泄露:中端定价却能“吊打”旗舰?

全球开发者社区正因一场“史诗级”的泄露而沸腾。多方证据显示,Anthropic 的新一代编程大模型 Claude Sonnet5(代号 Fennec)已现身谷歌云基础设施,并有望于2026年2月初正式发布。这款被业内戏称为“把整个开发团队塞进模型里”的巨作,正以极其恐怖的性能指标向市场宣告编程 AI 的巅峰时刻已经到来。

此次泄露源于开发者在调用 API 时意外触发的404错误日志,揭示了该模型已完成部署。初步测评数据显示,Sonnet5在处理复杂 UI 渲染和结构化视觉生成任务时表现惊人。更令竞争对手不安的是,虽然其定位为中端的“Sonnet”系列,但在多项内部基准测试中,其整体性能已全面超越了自家的顶级旗舰 Claude Opus4.5。

Sonnet5的核心杀手锏在于其强大的“蜂群模式(Agent Swarm)”。在 Dev Team 开发模式下,该模型能根据需求自动拆分任务,并在后台生成多个子智能体(如前端构建、后端开发、QA 测试等)进行并行协作。这意味着它不再只是一个辅助写代码的插件,而是一个可以自主组织、自我迭代、无需休假的数字化研发团队。

为了彻底解决开发者对大模型“又贵又慢”的痛点,Sonnet5依托谷歌 TPU 进行了深度优化。其推理成本大幅下降,定价仅为 Opus4.5的50%,同时提供高达100万 token 的上下文窗口。面对 OpenAI 即将发布的 Codex 全家桶,Anthropic 此举显然带有“正面硬刚”的杀气,软件工程的生产力范式或将在近日迎来彻底重构。

划重点:

🚀 越级挑战:代号 Fennec 的 Sonnet5性能超越旗舰级 Opus4.5,且在 SWE-Bench 编程基准测试中得分突破80.9%。
🤖 蜂群协作:首创“自动开发团队”模式,能自主生成并调度多个子智能体并行工作,实现从需求到功能的完整交付。
💸 极致性价比:定价直接腰斩50%,并提供100万 token 超长上下文,运行速度更快且延迟更低。

via AI新闻资讯 (author: AI Base)
Claude 5 震撼曝光:Anthropic 祭出“代号 Fennec”,编程模型格局将变

根据近期泄露的行业情报,Anthropic 的下一代大模型 Claude Sonnet5(内部代号 Fennec)已部署于谷歌基础设施中,发布在即。这款被视为“史上最强编程模型”的新品,不仅在性能上实现越级突破,更通过价格战和全新的“蜂群”开发模式,直击当前编程 AI 的所有痛点。

核心亮点:性能吊打旗舰,价格直降五成

Claude Sonnet5的出现并非简单的迭代,而是一次降维打击:

越级性能:尽管定位为中端 Sonnet 系列,但在多项内部基准测试中,其整体表现已超越了现有的旗舰级 Claude Opus4.5。

极致定价:由于直接在谷歌 TPU 上进行优化训练,其推理成本大幅下降,定价预计仅为 Opus4.5的50%。

百万长上下文:拥有100万 token 的超大上下文窗口,能够一次性吞下整个项目代码库,从全局视角理解并交付代码,彻底解决“遗留系统”和“屎山代码”的重构难题。

技术突破:SWE-Bench 跑分突破80%

在衡量 AI 编程能力的权威榜单 SWE-Bench 上,Claude Sonnet5取得了超过80.9% 的惊人成绩,远超目前市面上所有编程模型(此前的最高纪录为74.4%)。这意味着它能独立完成从修 Bug、跑 CI 到找回归问题的软件工程师全量日常工作。

“蜂群”模式:一个不请假的 AI 开发团队

Claude Sonnet5最具颠覆性的功能是 Dev Team(开发团队模式),即所谓的“蜂群”架构(Agent Swarm):

自我组织:只需输入一个需求,模型会自动生成总指挥、前端开发、后端开发、QA 测试等多个子智能体。

并行协作:这些智能体能并行工作、互相校验,甚至能根据任务需要“自我增殖”产生新的专项智能体,最终输出完整可运行的功能模块。

工业级产出:任务结束后,系统能自动生成项目总结与执行报告,其产出质量已达到工程管理级别。

行业影响:正面硬刚 OpenAI

Anthropic选择在此时泄露 Sonnet5,用意在于正面阻击 OpenAI 即将发布的 Codex 全家桶。

市场地位:截至2025年 Q4,Anthropic 在企业市场的占有率已达40%,领跑行业。

商业闭环:Claude Code 的年化收入仅用半年就突破了10亿美元,显示出开发者对高效编程工具的巨大付费意愿。

via AI新闻资讯 (author: AI Base)
微信小程序教育平台免费向师生开放,AI 教学项目超 17 万

近日,微信官方公布了“微信小程序教育平台”的最新成绩单。数据显示,截至目前,全球已有超过 5000 所学校深度接入该平台,共同探索 AI 课程的融合教学,师生们已累计在平台上创建了超过 17 万个小程序项目。

作为一款专为教学设计的工具,微信小程序教育平台已经历了五年的持续迭代。该平台致力于为师生提供免费的“学、用、教”全流程能力,显著降低了 AI 创作的门槛。在创作工具端,平台提供功能完备的在线代码编辑器,支持师生实时预览并一键发布作品。而在教学环节,平台不仅提供了贴合信息科技课标的官方课程库,还引入了 AI 老师进行辅助教学。

值得关注的是,平台集成的 AI 教学助手已支持自然语言创作和“文生图”等前沿应用。这意味着学生可以通过简单的文字指令进行编程尝试,极大地激发了青少年的创造力。以广东廉江安铺中学为例,该校已在七年级至高三全线铺开 AI 相关课程,通过小程序赋能,成功开展了“人工智能+传统文化”等一系列跨学科项目式学习。

微信团队表示,未来将继续加大在 AI 教育领域的投入,并计划邀请更多教育专家和教师加入,共同构建更加丰富的智慧教学生态。

划重点:

🚀 规模化覆盖:全球超 5000 所学校接入,师生累计创建小程序项目已突破 17 万个。
🛠️ 全流程赋能:提供从代码编辑、云端存储到 AI 助手辅助创作的免费“学用教”一体化工具。
🎓 深度融合:成功在多所中学实现全学段 AI 课程普及,通过“自然语言创作”降低编程学习门槛。



via AI新闻资讯 (author: AI Base)
#cloudflare #AI #agent

🦞 Moltworker - 在 Cloudflare Workers 上运行 OpenClaw

Moltworker 是一个基于 Cloudflare 平台的自托管个人 AI 代理。每个月仅需 $5。

OpenClaw 是最近很火的一个 Agent,刚出炉的时候叫 Clawdbot,后面改名字叫 Moltbot ,现在则是叫 OpenClaw。[2026.02.02]

它能迅速走红的原因是用户开始对只会聊天的 AI 有些厌倦了,而 OpenClaw 与传统的 AI 不同的是,它可以帮你操控你的系统。

因而它也需要更高的权限,所以运行在自己的设备显得有点不太安全,Moltworker 则出现的刚刚好。

↗️ 相关阅读

▫️OpenClaw 官方中文文档
▫️开源页面

📮投稿 📢频道 💬群聊 🔎索引

via 极客分享 - Telegram Channel
🤖 图灵奖得主 Yann LeCun 公开表态使用 Google Gemini

图灵奖得主、Meta 前首席 AI 科学家 Yann LeCun 近日在 LinkedIn 平台公开表示其正在使用 Google Gemini。LeCun 长期对自回归大型语言模型持批评态度,他于 2025 年 11 月离开 Meta 并创立了 Advanced Machine Intelligence Labs。他在社交动态中明确表态“我为 Gemini 代言”,展现了对该 AI 产品的偏好。

(科技圈)

via 茶馆 - Telegram Channel
Meta 前首席 AI 科学家 LeCun 在领英公开表示偏好 Google Gemini

Yann LeCun于LinkedIn评论中以“I use Gemini”公开表态使用Google Gemini。 他是图灵奖得主,曾任Meta首席AI科学家、长期批评自回归大型语言模型,2025年11月离开Meta创立Advanced Machine Intelligence Labs。

PPC

我是(前)Meta 杨立昆,我为 Gemini 代言。


🍀在花频道🍵茶馆聊天📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
智能交通新时代:大模型网关如何改变 AI 应用的格局

随着这些技术的普及,AI 相关的 API 流量激增,催生了 “智能交通枢纽”—— 大模型网关。这个新兴的技术解决方案旨在高效管理 AI 流量,确保企业能够顺利使用各种 AI 模型。

在现实业务中,企业面临着如何有效接入和管理多种 AI 模型的挑战。这些模型可能来自于不同的提供商,API 接口和数据格式各异,如果各部门单独搭建接入能力,势必导致资源浪费和技术碎片化。因此,企业需要一个集中统一的解决方案来管理这些 AI 模型。

大模型网关正是为此而生。它不仅连接业务与 AI 基础设施,还能够提供针对 AI 请求的优化管理能力。与传统的 API 网关不同,大模型网关专注于处理长时与流式响应、复杂的输入输出,以及高资源消耗的 AI 工作负载。它能够有效管理模型的使用成本、保障数据安全、提升服务的稳定性。

以得物为例,该平台在引入多种 AI 模型的过程中,遇到了模型调用成本激增、数据安全隐患以及服务稳定性等一系列挑战。为了解决这些问题,得物决定自建大模型网关,以实现资源的高效利用和成本的严格控制。

在实施过程中,得物采取了六项策略,首先是建立一个信息丰富的 “模型市场”,方便业务团队选择合适的 AI 模型。其次,构建统一的访问 API,让不同业务线可以轻松接入 AI 服务。此外,得物还推出了全流程的成本管控体系,通过优化模型使用,显著降低了运营成本。

大模型网关的出现,标志着企业在 AI 应用管理上的新突破。通过提升接入效率、保障数据安全和优化成本,企业能够更灵活地应对市场需求,实现业务的可持续发展。

via AI新闻资讯 (author: AI Base)
拒绝“毁经典”!国家广电总局出手:抖音小红书下架数千条 AI 魔改视频

随着人工智能生成内容(AIGC)的泛滥,针对影视经典及英雄模范人物的恶意篡改行为正面临严厉监管。记者从国家广播电视总局获悉,自2026年1月1日起,全国范围内开展了为期一个月的“AI 魔改”视频专项治理行动。

核心整治:守护经典与英模形象

本次专项行动将重点指向了对社会主流价值及文化遗产的保护。治理范围包括但不限于:

● 古典名著: 严禁对“四大名著”等经典电视剧作品进行扭曲原意的 AI 篡改。
● 严肃题材: 重点整治涉及历史题材、革命题材视频的违规“魔改”。
● 人物尊严: 坚决打击针对英模人物等影视作品内容的 AI 二次创作乱象。

平台战报:数千条违规视频被清理

近日,多家网络视听平台相继公布了本次专项治理的最终处理结果,通过技术识别与人工审核双重手段清理违规内容:

● 抖音: 专项治理期间,平台累计处置涉“AI 魔改”违规视频 6713条
● 小红书: 累计清理处置违规内容 1394条,并对 61个 违规账号进行了封禁或处罚。

未来展望:常态化监管已成定局

国家广电总局表示,专项行动虽暂告一段落,但治理不会止步。后续各平台将建立常态化治理机制,严防“AI 魔改”视频回潮,确保网络视听空间清朗有序,尊重原创版权与历史事实。

via AI新闻资讯 (author: AI Base)
前 OpenAI 专家发出警示:AI 不会“吃一堑长一智”,AGI面临关键瓶颈

尽管当前的AI大模型在逻辑推理和任务处理上表现惊人,但一个长期被忽视的技术缺陷可能正成为通往通用人工智能(AGI)道路上的巨大障碍。近日,曾参与 OpenAI 推理模型 o1和 o3开发的核心研究员 Jerry Tworek 在受访时直言:目前的AI模型根本无法从错误中汲取教训。

Tworek 指出,当现有的AI模型在处理问题失败时,开发者往往会陷入一种无力感,因为目前还缺乏有效的机制让模型根据失败经验来更新其内在的知识体系或信念。他形容当前的AI训练过程本质上是“极其脆弱的”,一旦遇到训练模式之外的新挑战,模型就很容易陷入“推理崩溃”的困境,这与人类那种具备自我稳定和自我修复能力的鲁棒性学习方式形成了鲜明对比。

正是为了攻克这一难题,Tworek 已于近期离开 OpenAI,专注于寻找让AI能够自主解决困难、摆脱困境的技术路径。他强调,如果一个模型不能在面对挫折时自我进化,那么它就很难被称为真正的 AGI。在他看来,智能的本质应该像生命一样“总能找到出路”,而当前的AI显然还远未达到这种境界。

划重点:

🧠 核心缺陷:前 OpenAI 研究员 Jerry Tworek 指出当前AI模型缺乏从失败中学习的机制,无法像人类一样通过纠错来更新内部知识。
🚧 AGI障碍:模型在处理未知模式时的“脆弱性”和容易“卡死”的状态,被认为是实现通用人工智能(AGI)的主要技术壁垒。
🛠️ 专家动向:为解决这一根本性难题,o1系列模型的幕后功臣 Tworek 已离职并投身于研发能自主摆脱困境的新一代AI架构。

via AI新闻资讯 (author: AI Base)
AI 学霸遭遇重创!GPT-4o 专家考试仅得 2.7 分

最近一项名为 “人类终极考试”(HLE)的测试结果让我们重新审视 AI 的真实能力。根据《自然》杂志的报道,GPT-4o 在这 2500 道由全球专家出题的测试中,仅获得了可怜的 2.7 分(满分 100 分),而表现最好的 AI 模型也仅得 8 分。这一结果让人质疑,AI 的强大究竟是实打实的实力,还是表面的繁荣?

传统的 AI 测试越来越无法反映真实能力,主要原因有两个。一是 “基准饱和”,即 AI 系统已经将常规测试题目背得滚瓜烂熟,得分的高低与真正的理解能力无关;二是 “答案作弊”,很多测试的答案可以直接在网上找到,使得 AI 看似答对问题,但实际上只是依赖于检索和记忆,而非真正的推理能力。

为了解决这些问题,HLE 的设计者们集结了来自 50 个国家的近 1000 名专家,确保每道题目都要求深层的专业知识,难度大幅提升。HLE 的题目不仅覆盖了数学、物理、化学等多个领域,还设定了严格的审核流程,确保题目难度足够,难以被 AI 轻易破解。比如数学题需要深入逻辑推理,化学题涉及复杂的反应机制,绝不是简单的检索就能得到答案。

测试结果一目了然:GPT-4o 仅得 2.7 分,Claude 3.5 Sonnet 和 Gemini 1.5 Pro 也只分别获得 4.1% 和 4.6% 的准确率,表现最好的 o1 也仅得 8%。这些数据清楚地表明,即便是最新一代的 AI,在面对真正需要深厚专业知识的问题时,依然显得无能为力。

通过 HLE 的测试,我们可以看到 AI 的真实能力与传统基准测试中的高分形成了鲜明对比。这也促使我们重新思考,AI 是否真的如我们想象中那样聪明,还是只是一种表象的成功。

via AI新闻资讯 (author: AI Base)
机构:用户对AI应用热情高涨 AIGC APP月活用户净增超2亿

根据 QuestMobile 最新发布的数据,截止到 2025 年 12 月,中国的月活跃用户总数已经突破了惊人的 12.76 亿人,用户的月均使用时长达到 186.2 小时,比去年增长了 8.4%。这一数据的背后,反映出用户对于移动互联网服务的热情日益高涨,尤其是在人工智能技术不断进步的推动下。

数据显示,尤其在 12 月份,AIGC(人工智能生成内容)应用行业表现尤为亮眼,月活跃用户规模净增超过 2 亿,年同比增速高达 150.4%。这标志着 AIGC 应用正在快速占领用户的注意力,成为互联网应用的新宠。AI 技术的红利正在释放,许多用户通过这些应用获得了更高效、更智能的服务体验。

此外,AI 应用插件也表现出强劲的增长势头。其月活跃用户数量已达到 6.96 亿,同比增速达 37.8%。这意味着,越来越多的用户开始主动使用这些智能工具来提升日常生活和工作的便利性。这种趋势不仅反映出用户对 AI 技术的接受程度提高,也说明了 AI 在日常应用场景中的重要性。

随着 AI 技术的发展,用户对智能内容生成和应用的需求正在不断上升,未来这一领域有望继续保持快速增长的势头。无论是在娱乐、社交还是工作中,AIGC 应用都在不断塑造着我们的生活方式,让我们对未来的科技充满期待。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]