https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
近日,Mozilla 工程师在博客中分享了利用 Anthropic 的先进 AI 模型 Claude Mythos,成功排查出 Firefox 浏览器 271 个安全漏洞的幕后故事。根据此前的报道,Mozilla 团队在 Firefox 浏览器的 150 版本中,依靠 Mythos Preview AI 模型发现并修复了这些漏洞。
在这 271 个漏洞中,令人关注的是,180 个被评估为 “高危”,意味着用户在正常浏览网页时就可能受到影响;此外,还有 80 个中危漏洞和 11 个低危漏洞。为了回应外界对 AI 找 Bug 的质疑,Mozilla 公开了 12 份完整的 Bugzilla 报告,以证明这不是单纯的 AI 炒作。
Mozilla 工程师提到,为了克服 AI 在代码分析中常出现的 “幻觉” 现象,开发了一套专门的 Agent Harness(智能体套件)。以往,AI 分析代码时会产生大量看似合理但实际上虚构的报告,导致人工审核的成本大大增加。而这次的成功,得益于模型自身能力的提升和这套定制化工具的应用。
该套件可以向模型下达具体指令,例如 “在这个文件中找 Bug”,同时提供读写文件和评估测试用例的工具,并循环执行直到任务完成。具体操作中,套件指向特定的源文件,Mythos 会自主生成测试用例,比如特定的 HTML 代码,随后利用现有的模糊测试工具进行测试。如果触发内存崩溃,就可以确认存在漏洞。为了进一步过滤误报,Mozilla 还引入了第二个大型模型,对第一模型的输出进行打分,只有高分的报告才会提交给开发者。
Mozilla 的杰出工程师 Brian Grinstead 表示,经过双重验证后,最终生成的漏洞报告几乎没有误报,这为工程师提供了明确的确认信号:问题确实存在,修复工作已经完成,且测试用例入库后不会再复现。
划重点:
🌟 271 个安全漏洞中,有 180 个被评为 “高危”,可能影响用户正常使用。
🤖 Mozilla 利用 AI 模型和智能体套件有效发现和修复漏洞。
🔍 通过双重验证,最终报告几乎没有误报,确保漏洞修复的准确性。
via AI新闻资讯 (author: AI Base)
根据微软在 2026 年发布的一份报告,全球 17.8% 的适龄劳动力正在使用生成式人工智能,但发达国家与发展中国家之间的差距正在加大。报告显示,在 2026 年第一季度,发达国家 15 至 64 岁的人群中,27.5% 的人使用了生成式 AI 工具,而发展中国家的这一比例仅为 15.4%。这一差距比 2025 年下半年扩大了 1.5 个百分点。
造成这种分化的原因主要在于互联网接入、基本数字技能和电力的严重不平等。此外,AI 模型在英语上的表现更为强劲,因为大多数主要 AI 公司都位于美国,这也限制了非英语国家的工具传播。然而,处理非欧洲语言的技术进步正在推动一些国家,特别是亚洲国家,赶上 AI 工具的使用。
在 AI 使用率方面,阿联酋以 70.1% 的比例位居首位,紧随其后的是新加坡、挪威、爱尔兰和法国。需要注意的是,这些数据主要是基于运行 Windows 和微软产品(如 Bing 和 Copilot)的计算机测量得出的,苹果设备上的使用情况部分被忽略,且关于俄罗斯、伊朗和中国的数据并不完整。
尽管如此,微软在报告中表示,针对由于自动化带来的失业担忧,AI 编程工具可能会增加开发者岗位的需求。不过,微软也警告说,目前尚难以预测 AI 对劳动力市场的全面影响。在 2026 年 4 月,微软首次向近 9000 名美国员工提供了自愿离职的机会。同时,根据 Layoffs.fyi 的数据,自 2023 年 1 月以来,科技行业已有近 99,000 名员工被裁员,主要集中在美国。
划重点:
📊 全球 17.8% 的适龄劳动力正在使用生成式 AI,富国与穷国差距加大。
🌍 发达国家 AI 使用率为 27.5%,而发展中国家仅为 15.4%。
🚀 阿联酋以 70.1% 的比例领先全球 AI 使用,报告指出不平等的技术接入问题。
via AI新闻资讯 (author: AI Base)
OpenAI 发布三款实时语音模型,GPT-5 级推理能力落地
人工智能巨头 OpenAI 再次刷新了语音交互的技术边界,正式推出了三款全新的实时语音模型:GPT-Realtime-2、GPT-Realtime-Translate 以及 GPT-Realtime-Whisper。这三款模型目前已集成至 Realtime API 供开发者使用,旨在从底层技术上攻克语音交互中长期存在的延迟高、无法自然打断以及多语言支持难等痛点。
作为此次发布的重头戏,GPT-Realtime-2 被定义为目前最智能的 AI 语音模型,也是首个具备 GPT-5 级推理能力的语音工具。与传统的语音助手不同,它在保持对话极度自然流畅的同时,能够实时进行复杂的逻辑推理、灵活调用外部工具,并能精准识别且处理用户的打断或纠正。这一突破意味着未来的语音助手将不再只是简单的指令执行者,而是能处理多步骤复杂任务的实时协作伙伴。
在定价策略上,GPT-Realtime-2 的音频输入费用设定为每百万 Token 32 美元(约合人民币 218 元),输出费用为 64 美元(约合人民币 436 元),而缓存输入的成本显著降低,仅需 0.4 美元。
除了核心推理模型,另外两款功能性模型也各具特色。GPT-Realtime-Translate 展现了强大的翻译性能,支持 70 种输入语言与 13 种输出语言的即时转换,其翻译速度几乎与说话者同步,能够胜任跨国会议等高要求的实时沟通场景。而 GPT-Realtime-Whisper 则专注于追求极致的流式转录,实现了“音随人动”的低延迟体验,极大缩短了会议记录和实时字幕的等待时间。这两款模型的计费方式更为灵活,分别按分钟计费,价格为每分钟 0.034 美元和 0.017 美元。
业内分析认为,OpenAI 这一系列动作标志着 AI 语音交互正从“简单响应”向“深度实时理解”跨越,进一步巩固了其在智能时代的技术领先地位。
via AI新闻资讯 (author: AI Base)
人工智能巨头 OpenAI 再次刷新了语音交互的技术边界,正式推出了三款全新的实时语音模型:GPT-Realtime-2、GPT-Realtime-Translate 以及 GPT-Realtime-Whisper。这三款模型目前已集成至 Realtime API 供开发者使用,旨在从底层技术上攻克语音交互中长期存在的延迟高、无法自然打断以及多语言支持难等痛点。
作为此次发布的重头戏,GPT-Realtime-2 被定义为目前最智能的 AI 语音模型,也是首个具备 GPT-5 级推理能力的语音工具。与传统的语音助手不同,它在保持对话极度自然流畅的同时,能够实时进行复杂的逻辑推理、灵活调用外部工具,并能精准识别且处理用户的打断或纠正。这一突破意味着未来的语音助手将不再只是简单的指令执行者,而是能处理多步骤复杂任务的实时协作伙伴。
在定价策略上,GPT-Realtime-2 的音频输入费用设定为每百万 Token 32 美元(约合人民币 218 元),输出费用为 64 美元(约合人民币 436 元),而缓存输入的成本显著降低,仅需 0.4 美元。
除了核心推理模型,另外两款功能性模型也各具特色。GPT-Realtime-Translate 展现了强大的翻译性能,支持 70 种输入语言与 13 种输出语言的即时转换,其翻译速度几乎与说话者同步,能够胜任跨国会议等高要求的实时沟通场景。而 GPT-Realtime-Whisper 则专注于追求极致的流式转录,实现了“音随人动”的低延迟体验,极大缩短了会议记录和实时字幕的等待时间。这两款模型的计费方式更为灵活,分别按分钟计费,价格为每分钟 0.034 美元和 0.017 美元。
业内分析认为,OpenAI 这一系列动作标志着 AI 语音交互正从“简单响应”向“深度实时理解”跨越,进一步巩固了其在智能时代的技术领先地位。
via AI新闻资讯 (author: AI Base)
阶跃星辰拟完成25亿美元融资并拆除红筹架构,加速赴港IPO进程
国产大模型独角兽阶跃星辰正接近完成新一轮总额约25亿美元的融资,并已完成红筹架构拆除工作,正式进入赴港IPO的加速筹备期。本轮融资呈现出显著的产业资本聚集特征,华勤、龙旗、豪威及中兴等产业链核心企业悉数入场,涵盖了从移动整机制造到上游半导体器件的关键环节。
这种资本结构的变动反映出大模型能力向移动终端迁移的确定性行业趋势。与此同时,市场传闻OpenAI亦在秘密研发首款AI Agent手机,预计最快于2027年上半年实现量产,阶跃星辰在此时点获得硬件产业链背书,显示出其在终端AI化竞争中的战略前瞻性。
值得关注的是,被誉为“港版淡马锡”的香港投资管理有限公司(HKIC)也位列股东名单,这不仅为阶跃星辰的港股上市提供了强有力的官方背书,更强化了其在粤港澳大湾区AI产业集群中的核心地位。在国产大模型融资环境持续升温的背景下,近期月之暗面亦传出将完成20亿美元规模的新轮次融资。阶跃星辰通过引入深度产业资源,正试图从算法研发向产业落地深度渗透,其赴港上市后的资本表现及技术产品化路径,或将重塑国内通用人工智能产业的市场格局与竞争门槛。
via AI新闻资讯 (author: AI Base)
国产大模型独角兽阶跃星辰正接近完成新一轮总额约25亿美元的融资,并已完成红筹架构拆除工作,正式进入赴港IPO的加速筹备期。本轮融资呈现出显著的产业资本聚集特征,华勤、龙旗、豪威及中兴等产业链核心企业悉数入场,涵盖了从移动整机制造到上游半导体器件的关键环节。
这种资本结构的变动反映出大模型能力向移动终端迁移的确定性行业趋势。与此同时,市场传闻OpenAI亦在秘密研发首款AI Agent手机,预计最快于2027年上半年实现量产,阶跃星辰在此时点获得硬件产业链背书,显示出其在终端AI化竞争中的战略前瞻性。
值得关注的是,被誉为“港版淡马锡”的香港投资管理有限公司(HKIC)也位列股东名单,这不仅为阶跃星辰的港股上市提供了强有力的官方背书,更强化了其在粤港澳大湾区AI产业集群中的核心地位。在国产大模型融资环境持续升温的背景下,近期月之暗面亦传出将完成20亿美元规模的新轮次融资。阶跃星辰通过引入深度产业资源,正试图从算法研发向产业落地深度渗透,其赴港上市后的资本表现及技术产品化路径,或将重塑国内通用人工智能产业的市场格局与竞争门槛。
via AI新闻资讯 (author: AI Base)
OpenAI在其API中推出新的语音智能功能
AI公司OpenAI周四表示,其 API现在将包括一系列新的语音智能功能,旨在帮助开发者创建能够与用户进行对话、转录以及翻译对话的应用。该公司的新款GPT‑Realtime‑2是另一个语音模型,旨在创建能够与用户对话的逼真语音模拟。然而,与其前代模型不同的是,这款模型采用了 GPT‑5 级别的推理能力,OpenAI公司表示该推理能力是为了处理用户更复杂的请求而创建的。该公司还推出了GPT‑Realtime‑Translate,正如其名,旨在提供与用户对话节奏 “保持同步” 的实时翻译服务。该功能包括超过70种输入语言和13种输出语言。最后,还推出了一项新的转录功能GPT‑Realtime‑Whisper,为用户提供在交互发生时即时捕捉的实时语音转文本功能。
—— Techcrunch
via 风向旗参考快讯 - Telegram Channel
AI公司OpenAI周四表示,其 API现在将包括一系列新的语音智能功能,旨在帮助开发者创建能够与用户进行对话、转录以及翻译对话的应用。该公司的新款GPT‑Realtime‑2是另一个语音模型,旨在创建能够与用户对话的逼真语音模拟。然而,与其前代模型不同的是,这款模型采用了 GPT‑5 级别的推理能力,OpenAI公司表示该推理能力是为了处理用户更复杂的请求而创建的。该公司还推出了GPT‑Realtime‑Translate,正如其名,旨在提供与用户对话节奏 “保持同步” 的实时翻译服务。该功能包括超过70种输入语言和13种输出语言。最后,还推出了一项新的转录功能GPT‑Realtime‑Whisper,为用户提供在交互发生时即时捕捉的实时语音转文本功能。
—— Techcrunch
via 风向旗参考快讯 - Telegram Channel
ChatGPT 新增“信任联系人”功能,检测到自残话题时可通知亲友
OpenAI 为 ChatGPT 成年用户推出可选安全功能“信任联系人”,用户可指定一位朋友、家人或照护者。当系统检测到用户可能谈论自残或自杀时,ChatGPT 会先鼓励用户联系该联系人,并告知联系人可能被通知;经受过专门培训的团队审核后,若确认存在严重安全顾虑,会向联系人发送邮件、短信或 ChatGPT 应用内通知,但不共享聊天内容。须双方均为成年人(韩国需 19 岁以上),且联系人需在收到邀请后一周内接受。
该功能是对此前青少年安全选项的扩展,背景是一名 16 岁少年在长期与 ChatGPT 倾诉后自杀身亡。Meta 也在 Instagram 推出了类似功能,当孩子反复搜索自残话题时会通知家长。
The Verge
🌸 在花频道 · 茶馆讨论 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
OpenAI 为 ChatGPT 成年用户推出可选安全功能“信任联系人”,用户可指定一位朋友、家人或照护者。当系统检测到用户可能谈论自残或自杀时,ChatGPT 会先鼓励用户联系该联系人,并告知联系人可能被通知;经受过专门培训的团队审核后,若确认存在严重安全顾虑,会向联系人发送邮件、短信或 ChatGPT 应用内通知,但不共享聊天内容。须双方均为成年人(韩国需 19 岁以上),且联系人需在收到邀请后一周内接受。
该功能是对此前青少年安全选项的扩展,背景是一名 16 岁少年在长期与 ChatGPT 倾诉后自杀身亡。Meta 也在 Instagram 推出了类似功能,当孩子反复搜索自残话题时会通知家长。
The Verge
🌸 在花频道 · 茶馆讨论 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
🔁 #Update #Codex
Forwarded From Agent Copilot
#Update #Codex
Codex for Chrome 插件现已发布,可接管 Chrome 执行任务。
该插件需要在 Codex App 的 Plugins 中手动启用。
官方文档:https://developers.openai.com/codex/app/chrome-extension
via AI Copilot - Telegram Channel
Forwarded From Agent Copilot
#Update #Codex
Codex for Chrome 插件现已发布,可接管 Chrome 执行任务。
该插件需要在 Codex App 的 Plugins 中手动启用。
官方文档:https://developers.openai.com/codex/app/chrome-extension
via AI Copilot - Telegram Channel
Perplexity 宣布,其个人电脑应用现已向所有 Mac 用户开放。这款应用的正式名称为 “个人电脑”,旨在为用户提供本地 AI 助手的功能,帮助用户更高效地完成日常工作。与以往的云端计算不同,个人电脑允许 AI 助手直接访问用户的本地文件、应用程序和网络,以支持复杂的个人工作流程。
个人电脑的推出旨在满足市场对本地 AI 助手的日益增长的需求。通过与 OpenClaw 等工具相比,Perplexity 强调其产品在安全性方面的优势,以避免因为提升权限而带来的潜在安全风险。虽然个人电脑早在上个月就已推出,但当时仅限于 Perplexity Max 订阅用户使用,并设有等待名单。而如今,所有 Mac 用户均可下载并体验这款应用,不过要使用个人电脑的功能,则需拥有 Pro 或 Max 订阅。
目前,个人电脑软件能够处理用户的本地文件、使用原生 Mac 应用,并在网络上运行。它还可以协调各种工具和文件,使用超过 400 个连接器,充分利用用户的个人上下文,并在 Perplexity 的安全开发环境中操作。如果与 Perplexity 的 Comet 浏览器搭配使用,用户可以在无需直接连接的情况下运行网络工具。
此外,个人电脑设计用于在如 Mac Mini 这样的始终在线设备上运行,用户还可以通过 iPhone 远程访问,随时启动任务或批准请求。这使得在处理电子表格、文档及多种项目时,用户能够更加便捷高效。由于个人电脑的全面上线,Perplexity 计划在未来几周内逐步停用其旧版 Mac 应用,以集中精力发展个人电脑。
目前,这款新的 Mac 应用只能通过官方网站直接下载,尚未在 Mac App Store 上架。
划重点:
🔹 Perplexity 个人电脑应用现已开放,旨在为 Mac 用户提供本地 AI 助手功能。
🔹 用户可以通过个人电脑直接访问本地文件和应用,增强工作效率,但需订阅 Pro 或 Max 计划。
🔹 应用支持远程访问,方便用户随时管理任务,未来将逐步停用旧版 Mac 应用。
via AI新闻资讯 (author: AI Base)
根据《纽约时报》和 CNBC 的报道,SpaceX 正在德克萨斯州奥斯汀市计划投资至少 550 亿美元,建设其名为 “Terafab” 的 AI 芯片制造厂。
这一信息来源于德克萨斯州格莱姆斯县的一次公共听证会公告,该公告主要是为项目申请税收优惠。SpaceX 表示,如果未来增加更多建设阶段,整体投资额有可能达到 1190 亿美元。
埃隆・马斯克在三月份首次宣布该项目时,分享了其雄心勃勃的计划,预计每年将生产足够的芯片,以支持高达 200 千兆瓦的地面计算能力,以及在太空中达到 1 太瓦的计算能力。与此同时,SpaceX 还在努力扩大其在地球上的数据中心业务。目前,该公司在田纳西州孟菲斯运营着一个名为 “Colossus” 的数据中心,并已与人工智能公司 Anthropic 达成协议,提供其 AI 模型所需的计算支持。
位于德克萨斯州的芯片工厂将由 SpaceX 和特斯拉共同运营,制造的芯片将服务于两家公司。马斯克表示,这些芯片将用于人工智能、机器人技术以及太空数据中心。上个月,英特尔宣布将帮助设计和建造 Terafab,表示 “我们在设计、制造和包装超高性能芯片方面的能力,将有助于加速 Terafab 实现每年生产 1 太瓦计算能力的目标,以推动未来的 AI 和机器人技术进步。”
划重点:
- 🚀 SpaceX 计划在德克萨斯州投资 550 亿美元建设 AI 芯片工厂,未来可能达到 1190 亿美元。
- 💻 该工厂预计将每年生产支持 200 千兆瓦地面计算和 1 太瓦太空计算的芯片。
- 🤝 英特尔将协助设计和建造工厂,以推动 AI 和机器人技术的发展。
via AI新闻资讯 (author: AI Base)
法国检方升级对马斯克传唤 这次是刑事指控
法国检察官再次传唤埃隆·马斯克前往法国首都。这一次,他需要面对一项针对其 X 平台的大规模调查而提出的初步刑事指控。就在几周前,马斯克未出席法国检察官安排的一次自愿问询。新的传唤使这场跨大西洋争端进一步升级,双方就法国对 X 的长期调查处理方式产生分歧。此前,法国执法部门和检方于今年二月突击搜查了 X 位于巴黎的办公室,以寻找调查所需的证据。该调查于2025年启动,最初涉及算法存在偏见的指控,此后范围不断扩大,目前已涵盖违反通信保密规定、传播儿童色情内容及其Grok制作深度伪造性化图像等多项指控。法国检方周四表示,该调查现已升级为正式的刑事调查。
—— 凤凰网科技、华尔街日报
via 风向旗参考快讯 - Telegram Channel
法国检察官再次传唤埃隆·马斯克前往法国首都。这一次,他需要面对一项针对其 X 平台的大规模调查而提出的初步刑事指控。就在几周前,马斯克未出席法国检察官安排的一次自愿问询。新的传唤使这场跨大西洋争端进一步升级,双方就法国对 X 的长期调查处理方式产生分歧。此前,法国执法部门和检方于今年二月突击搜查了 X 位于巴黎的办公室,以寻找调查所需的证据。该调查于2025年启动,最初涉及算法存在偏见的指控,此后范围不断扩大,目前已涵盖违反通信保密规定、传播儿童色情内容及其Grok制作深度伪造性化图像等多项指控。法国检方周四表示,该调查现已升级为正式的刑事调查。
—— 凤凰网科技、华尔街日报
via 风向旗参考快讯 - Telegram Channel
Google DeepMind入股CCP Games,EVE Online成为通用人工智能实验场
Google DeepMind于2026年5月7日宣布收购太空大型多人在线(MMO)游戏《EVE Online》开发商CCP Games的少数股权,正式将该复杂虚拟世界纳入其人工智能模型测试体系。与此同时,CCP Games宣布以1.2亿美元的价格从原母公司韩国Pearl Abyss手中回购自身,并更名为Fenris Creations,这一交易价格相较2018年时的2.25亿美元估值大幅缩水。
此次战略入股的核心在于DeepMind对通用人工智能(AGI)沙箱环境的需求。DeepMind总监Alexandre Moufarek表示,EVE Online极高的社会经济复杂性使其成为研究AI模型长期规划、记忆能力及持续学习的理想场所。目前,DeepMind已在本地服务器运行该游戏的离线版本,旨在不受线上服务器Tranquility干扰的前提下,复现并攻克类似AlphaGo与AlphaStar在复杂策略博弈中面临的深层技术瓶颈。
从技术演进脉络看,DeepMind长期坚持将游戏作为AI进化的基准测试平台。EVE Online不仅拥有庞大的多智能体协作环境,更具备高度仿真的经济体系与政治博弈,这为当前以大语言模型为核心的AI智能体(AI Agents)提供了超越静态指令的动态演进空间。
Fenris首席执行官Hilmar Veigar Pétursson预计于5月中旬公布更多合作细节。此举标志着顶级AI实验室正将视野从单一的任务竞技转向大规模、长周期的社会性模拟,通过在高度拟真的虚拟社会中训练,进一步推动模型处理现实世界复杂决策的能力。
via AI新闻资讯 (author: AI Base)
Google DeepMind于2026年5月7日宣布收购太空大型多人在线(MMO)游戏《EVE Online》开发商CCP Games的少数股权,正式将该复杂虚拟世界纳入其人工智能模型测试体系。与此同时,CCP Games宣布以1.2亿美元的价格从原母公司韩国Pearl Abyss手中回购自身,并更名为Fenris Creations,这一交易价格相较2018年时的2.25亿美元估值大幅缩水。
此次战略入股的核心在于DeepMind对通用人工智能(AGI)沙箱环境的需求。DeepMind总监Alexandre Moufarek表示,EVE Online极高的社会经济复杂性使其成为研究AI模型长期规划、记忆能力及持续学习的理想场所。目前,DeepMind已在本地服务器运行该游戏的离线版本,旨在不受线上服务器Tranquility干扰的前提下,复现并攻克类似AlphaGo与AlphaStar在复杂策略博弈中面临的深层技术瓶颈。
从技术演进脉络看,DeepMind长期坚持将游戏作为AI进化的基准测试平台。EVE Online不仅拥有庞大的多智能体协作环境,更具备高度仿真的经济体系与政治博弈,这为当前以大语言模型为核心的AI智能体(AI Agents)提供了超越静态指令的动态演进空间。
Fenris首席执行官Hilmar Veigar Pétursson预计于5月中旬公布更多合作细节。此举标志着顶级AI实验室正将视野从单一的任务竞技转向大规模、长周期的社会性模拟,通过在高度拟真的虚拟社会中训练,进一步推动模型处理现实世界复杂决策的能力。
via AI新闻资讯 (author: AI Base)
AI竟然学会了“睡觉”:Claude任务成功率暴涨 6 倍背后的秘密
在人工智能进化的道路上,Anthropic公司再次投下了一枚重磅炸弹。在近日举办的开发者大会上,Anthropic为其旗下的智能体平台Claude引入了一项名为“Dreaming”(梦境)的突破性功能。这项技术的核心理念极具科幻色彩:让AI在任务间隙进入一种类似人类“睡眠”的状态,通过模拟快速眼动(REM)周期来整理和优化其记忆库。
长期以来,AI代理在处理长周期、复杂任务时常面临“记忆过载”的困扰。信息往往以碎片化形式堆积,随着交流深入,重复、过时甚至相互矛盾的数据会导致AI运行效率下降。而“Dreaming”功能的出现,相当于为AI提供了一个异步处理的“大脑后台”。它能同时调取多达 100 个历史会话的完整记录,通过合并重复项、更新陈旧信息、提炼宏观规律,将短期琐碎的记忆转化为长期、高价值的知识库。
严控风险:生成的记忆不直接覆盖
为了确保这一进化过程的安全性与可控性,Anthropic并未让AI“盲目”更新。Dreaming生成的优化版记忆库不会直接覆盖原始数据,开发者拥有一票否决权,可以在审查优化结果后再决定是否应用。同时,平台还配套推出了实时监控系统和自定义指令功能,让开发者能够像观察实验标本一样,清晰地看到AI整理记忆的每一个步骤,并引导其聚焦于特定主题。
此外,为了解决AI输出质量波动的痛点,Outcomes自动评分系统也同步上线。该系统通过独立的评估器对AI生成的成果进行精准打分,一旦发现缺陷,会立即指示AI重新优化,直到满足预设标准。
实测表现惊人:任务成功率实现跨越式增长
技术的优劣最终要靠数据说话。内部测试结果显示,Dreaming功能在多个应用场景中表现出色,文档生成任务的成功率普遍提升了8%至10%。在法律科技领域,合作伙伴Harvey的实践更是令人瞩目:应用该技术组合后,其任务完成率竟然飙升了约 6 倍。
在更复杂的协作场景中,多智能体编排系统展现了强大的协同能力。通过将宏大任务拆解为多个专业子任务并行处理,并在共享文件系统中汇总成果,系统的可靠性得到了质的飞跃。在月球采矿无人机着陆的模拟实验中,这套系统将安全评分从不及格的67%直接拉升至100%的完美标准。
算力加持:SpaceX超算中心提供后盾
如此高强度的记忆整理与模拟运算,背后离不开庞大算力的支撑。Anthropic宣布已与SpaceX达成深度战略合作,全量租赁了位于得克萨斯州的Colossus1 数据中心。凭借 22 万张高性能GPU的算力支持,Claude不仅能够轻松应对“梦境”产生的数据洪流,也让普通用户获得了实打实的福利:Claude Code使用限额翻倍,Pro/MAX版本的访问限制大幅放宽,API调用速度也得到了显著优化。
AI学会“睡眠”,或许正是其走向更高程度智能化的重要里程碑。
via AI新闻资讯 (author: AI Base)
在人工智能进化的道路上,Anthropic公司再次投下了一枚重磅炸弹。在近日举办的开发者大会上,Anthropic为其旗下的智能体平台Claude引入了一项名为“Dreaming”(梦境)的突破性功能。这项技术的核心理念极具科幻色彩:让AI在任务间隙进入一种类似人类“睡眠”的状态,通过模拟快速眼动(REM)周期来整理和优化其记忆库。
长期以来,AI代理在处理长周期、复杂任务时常面临“记忆过载”的困扰。信息往往以碎片化形式堆积,随着交流深入,重复、过时甚至相互矛盾的数据会导致AI运行效率下降。而“Dreaming”功能的出现,相当于为AI提供了一个异步处理的“大脑后台”。它能同时调取多达 100 个历史会话的完整记录,通过合并重复项、更新陈旧信息、提炼宏观规律,将短期琐碎的记忆转化为长期、高价值的知识库。
严控风险:生成的记忆不直接覆盖
为了确保这一进化过程的安全性与可控性,Anthropic并未让AI“盲目”更新。Dreaming生成的优化版记忆库不会直接覆盖原始数据,开发者拥有一票否决权,可以在审查优化结果后再决定是否应用。同时,平台还配套推出了实时监控系统和自定义指令功能,让开发者能够像观察实验标本一样,清晰地看到AI整理记忆的每一个步骤,并引导其聚焦于特定主题。
此外,为了解决AI输出质量波动的痛点,Outcomes自动评分系统也同步上线。该系统通过独立的评估器对AI生成的成果进行精准打分,一旦发现缺陷,会立即指示AI重新优化,直到满足预设标准。
实测表现惊人:任务成功率实现跨越式增长
技术的优劣最终要靠数据说话。内部测试结果显示,Dreaming功能在多个应用场景中表现出色,文档生成任务的成功率普遍提升了8%至10%。在法律科技领域,合作伙伴Harvey的实践更是令人瞩目:应用该技术组合后,其任务完成率竟然飙升了约 6 倍。
在更复杂的协作场景中,多智能体编排系统展现了强大的协同能力。通过将宏大任务拆解为多个专业子任务并行处理,并在共享文件系统中汇总成果,系统的可靠性得到了质的飞跃。在月球采矿无人机着陆的模拟实验中,这套系统将安全评分从不及格的67%直接拉升至100%的完美标准。
算力加持:SpaceX超算中心提供后盾
如此高强度的记忆整理与模拟运算,背后离不开庞大算力的支撑。Anthropic宣布已与SpaceX达成深度战略合作,全量租赁了位于得克萨斯州的Colossus1 数据中心。凭借 22 万张高性能GPU的算力支持,Claude不仅能够轻松应对“梦境”产生的数据洪流,也让普通用户获得了实打实的福利:Claude Code使用限额翻倍,Pro/MAX版本的访问限制大幅放宽,API调用速度也得到了显著优化。
AI学会“睡眠”,或许正是其走向更高程度智能化的重要里程碑。
via AI新闻资讯 (author: AI Base)
全线封杀!Claude桌面端收紧限制,DeepSeek V4 等第三方模型已无法直接接入
在编程与开发圈内,Anthropic 旗下的 Claude 系列模型一直凭借卓越的代码生成能力占据“第一梯队”。此前,Claude Desktop 桌面端应用曾短暂开启了 Gateway 模式,允许用户无需登录即可通过 API 接入其他厂商的大模型。这一“开放”举措恰逢 DeepSeek V4 降价热潮,吸引了大量开发者将 DeepSeek、GPT、Grok 等第三方模型整合进 Claude 的界面中使用。
然而,这种灵活的兼容性仅维持了约两周。根据最新技术实测,Claude 桌面端在更新至 1.6259.1 版本后,已正式对第三方 API 接入实施封杀。
引入白名单机制,精准拦截第三方 ID
此次更新的核心变动在于 Gateway 模式中新增了模型 ID 白名单校验。系统现在会严格检查接口返回的模型信息,仅允许以“claude”或“anthropic”命名的模型条目通过。这意味着,原本运行顺畅的 DeepSeek V4 等非原生模型,因不符合命名规则而无法继续在应用中显示或调用。
除了桌面应用外,同日发布的命令行工具 Claude Code CLI(版本 2.1.129)也同步收紧了集成规则。相比此前版本的默认开启,新版本已将网关模型发现功能改为“手动选择”模式,用户必须通过设置特定的环境变量才能开启查询。
技术对抗升级:本地代理暂成“避风港”
针对这一限制,社区开发者已展开技术博弈。目前的监测显示,Anthropic 的封锁手段尚处于模型 ID 校验阶段,并未对底层的通信协议或模型输出特征进行深度检测。已有部分用户通过搭建本地代理服务器,将第三方 API 的模型 ID 伪装映射为官方名称(如映射为 claude-sonnet-4-6)来绕过校验。
尽管此类“换壳”方案在现阶段依然有效,但行业分析认为,参考 Anthropic 一贯的闭环生态风格,未来不排除会升级检测手段以彻底封堵第三方模型的接入路径。对于习惯了低成本 API 配合强力 UI 界面的开发者而言,寻找 OpenCode 等开源替代方案或将成为新的选择。
via AI新闻资讯 (author: AI Base)
在编程与开发圈内,Anthropic 旗下的 Claude 系列模型一直凭借卓越的代码生成能力占据“第一梯队”。此前,Claude Desktop 桌面端应用曾短暂开启了 Gateway 模式,允许用户无需登录即可通过 API 接入其他厂商的大模型。这一“开放”举措恰逢 DeepSeek V4 降价热潮,吸引了大量开发者将 DeepSeek、GPT、Grok 等第三方模型整合进 Claude 的界面中使用。
然而,这种灵活的兼容性仅维持了约两周。根据最新技术实测,Claude 桌面端在更新至 1.6259.1 版本后,已正式对第三方 API 接入实施封杀。
引入白名单机制,精准拦截第三方 ID
此次更新的核心变动在于 Gateway 模式中新增了模型 ID 白名单校验。系统现在会严格检查接口返回的模型信息,仅允许以“claude”或“anthropic”命名的模型条目通过。这意味着,原本运行顺畅的 DeepSeek V4 等非原生模型,因不符合命名规则而无法继续在应用中显示或调用。
除了桌面应用外,同日发布的命令行工具 Claude Code CLI(版本 2.1.129)也同步收紧了集成规则。相比此前版本的默认开启,新版本已将网关模型发现功能改为“手动选择”模式,用户必须通过设置特定的环境变量才能开启查询。
技术对抗升级:本地代理暂成“避风港”
针对这一限制,社区开发者已展开技术博弈。目前的监测显示,Anthropic 的封锁手段尚处于模型 ID 校验阶段,并未对底层的通信协议或模型输出特征进行深度检测。已有部分用户通过搭建本地代理服务器,将第三方 API 的模型 ID 伪装映射为官方名称(如映射为 claude-sonnet-4-6)来绕过校验。
尽管此类“换壳”方案在现阶段依然有效,但行业分析认为,参考 Anthropic 一贯的闭环生态风格,未来不排除会升级检测手段以彻底封堵第三方模型的接入路径。对于习惯了低成本 API 配合强力 UI 界面的开发者而言,寻找 OpenCode 等开源替代方案或将成为新的选择。
via AI新闻资讯 (author: AI Base)