ChatGPT / AI新闻聚合

Horizon Summary: 2026-05-26 (ZH)

从 28 条内容中筛选出 9 条重要资讯。教宗良十四世发布人工智能伦理通谕 ⭐️ 9.0/10 用人工智能更慢地写出更好的代码 ⭐️ 8.0/10 Mullvad 推出针对 VPN 出口 IP 指纹识别的缓解措施 ⭐️ 8.0/10 加州提议豁免 Linux 于年龄验证法 ⭐️ 8.0/10 LSFMM+BPF 峰会讨论基于 LLM 的内核补丁审查 ⭐️ 8.0/10 SFC 回应 Bambu 违反 AGPLv3 协议 ⭐️ 8.0/10 半存活人脑用于药物测试 ⭐️ 8.0/10 欧盟初步调查：谷歌违反《数字市场法》…

8 小时前

活宝团队试验让AI当老板结果做什么赔什么底裤都不剩

via cnBeta.COM - 中文业界资讯站 (author: 稿源：GeekPark极客公园)

活宝团队试验让AI当老板结果做什么赔什么底裤都不剩

随着 AI 和 Agent 迅猛发展的当下，硅谷大量裁员，所有人都在心里问一句话：明天，我会被 AI 取代吗？面对这样的疑问，有人默默打开李一舟老师的 AI 课程；有人则呼吁让 AI 交税。但是，也有奇怪的一群人，决定让这个未来，提前到来，看看 AI 到底能不能代替人类，接管一切。国外一个团队，叫 Andon Labs，他们并非正经的商业初创团队，更像一个披着科技外衣的社会实验室。他们拿着市面上最聪明的几个大模型，把它扔进真实的社会里，再撤走人类监管，看 AI 自己能结出什么果。结果是一场全面翻车。…

9 小时前

OpenAI Codex 新增“锁屏运行”功能：Mac 桌面代理进入自动化新阶段

5 月 21 日至 22 日，OpenAI 正式宣布其桌面代理产品 Codex 新增 “Locked Use”（锁屏运行） 功能。该功能打破了传统 AI 代理必须在“解锁且屏幕常亮”状态下工作的限制，允许开发者在 Mac 锁定或息屏状态下，依然能够通过远程指令操控本地应用程序。

一、核心突破：不再需要“看守”你的电脑

在过去，执行长时长的复杂工程任务（如大型代码仓库编译、GUI 自动化测试）时，开发者往往需要通过“咖啡因”插件或外接假显示器来强行维持 Mac 处于唤醒状态。

Locked Use 的发布改变了这一现状：

● 后台自动化： 用户可以从手机发送任务指令，Codex 即可在 Mac 锁屏状态下自动执行 UI 操作、调整设置或运行桌面应用流程。
● 开发体验优化： 这一功能极大地提升了“多小时任务”的可行性，开发者无需再为维持电脑唤醒而“看守”设备。

二、技术实现与安全机制

为了在保证系统安全的前提下实现这一功能，OpenAI 采取了严谨的权限与约束架构：

● Apple 授权插件： 该功能通过一个特定的 Apple 授权插件实现。它并非一个通用的远程解锁路径，而是仅允许 Codex 代理在受限的行为约束下执行特定任务。
● 严格的权限管理： 运行该功能需要用户明确授予 屏幕录制（Screen Recording） 和 辅助功能（Accessibility） 权限。
● 行为“护栏”： ● 禁区限制： 该功能明确限制了代理对系统的底层控制，例如无法自动化控制终端（Terminal）或 Codex 自身，从而有效规避了恶意利用或失控风险。 ● 地理限制： 出于对区域性法律法规及 AI 智能体监管政策的考量，该功能在发布初期不适用于欧洲经济区（EEA）、英国及瑞士。 ● 操作约束： 若 MacBook 处于合盖状态（触发特定的休眠模式），该功能将无法继续工作。

三、行业视角：桌面代理安全的新命题

Codex 这一功能的推出，标志着桌面级 AI 代理正从“云端协作”走向“深度系统集成”。业内专家指出，这也引发了企业端对终端安全的新思考：

1. 合规性挑战： 这种能够绕过锁屏进行操作的“特权代理”，对于企业信息安全管理（尤其是涉及生产凭证的开发机器）提出了更高的审计与监控要求。
2. 信任模型升级： 操作系统如何为这类“信任代理”设定更精细化的权限等级，将成为未来 macOS 等桌面系统迭代的核心看点。
3. 安全审计需求： 目前，开发者仍无法完全“黑盒”化该进程。未来，如何提供操作日志回溯或 session 监控，将是企业大规模部署该类 AI 工具时的关键门槛。

四、功能适用范围

● 适用平台： 仅限安装了 Codex 桌面代理的 macOS 设备。
● 配置方式： 用户可在 Codex 设置界面中找到“Locked Use”选项进行开启。
● 场景建议： 主要面向重现 GUI 界面 Bug、自动化调整桌面应用配置、以及无需人工干预的离线任务处理。

OpenAI 此次更新，不仅进一步夯实了其在 AI 辅助开发领域的领跑地位，也为未来“无感化”的 AI 办公体验探索了一条高标准、强监管的落地路径。

via AI新闻资讯 (author: AI Base)

9 小时前

Degraded Performance for Agent Sessions

May 26, 03:04 UTC
Investigating - We are monitoring a service degradation affecting Agents sessions in IDE

via Cursor Status - Incident History

7 个实用技巧，让Claude Code的Token消耗爆降80%

via 掘金人工智能本月最热 (author: 程序新视界)

7 个实用技巧，让Claude Code的Token消耗爆降80%

不要只优化 Prompt，更要优化 Context。 Claude Code 很强大，这在前面的实践文章中我们已经验证过了，但与此同时，也有不少朋友说Token消耗过多，成本过高。面对这个问题，很多人第一反应是：是不是Prompt写得太啰嗦了？其实，很多时候真正“烧 Token”的，并不是输入的那句话，而是Claude背后带着的整段上下文。它们可能包括：之前的聊天记录已经读取过的代码文件工具调用输出像 CLAUDE.md 这样的记忆文件系统或后台注入的额外指令也就是说，当Token消耗…

苹果 Siri 重磅升级：1.2 万亿参数谷歌定制模型“掌脑”，本地运行速度成关键

北京时间 5 月 26 日，据多家媒体援引知情人士消息，苹果并非简单将 Gemini 集成到 Siri 中，而是正在采用一款由谷歌定制的1.2 万亿参数大型语言模型，作为下一代 Siri 核心 overhaul 的“大脑”。

这一规模远超当前主流移动端模型，引发业界高度关注。

模型规模碾压：1.2T vs Gemini 3.5 Flash 300B

据估算，Gemini 3.5 Flash 的参数量约为 3000 亿，而苹果此次采用的定制模型达到1.2 万亿参数，规模显著更大。AIbase分析指出，如此庞大的模型若能高效部署，将为 Siri 带来更强的理解、推理和复杂任务处理能力，尤其在多模态交互和上下文理解方面有望实现质的飞跃。

性能与速度：本地响应是最大考验

尽管模型参数激增，但苹果一贯注重用户隐私与实时性。报道强调，简单查询预计将优先在本地设备上运行。这意味着苹果必须解决大模型在 iPhone 等终端上的高效推理难题——既要保证回答日常问题的速度足够快，又要兼顾功耗和发热控制。

AIbase认为，模型“够大”并不必然等于“够好”。在移动场景下，延迟、能耗和准确率的平衡才是成败关键。苹果是否能在 1.2T 参数模型上实现高效本地 / 混合部署，将直接决定这次 Siri overhaul 的用户体验。

下半年 AI 大战一触即发

随着苹果在 WWDC 上即将展示 Apple Intelligence 与 Gemini 的深度融合，全球 AI 巨头竞赛进入新阶段。未来几个月值得期待的重磅更新包括：

● WWDC：Apple Intelligence 全面亮相，Siri 与 Gemini 定制模型结合
● GPT-5.6：OpenAI 下一代模型进展
● Sonnet 4.8 / Opus 4.8：Anthropic 可能同步迭代
● Gemini 3.5 Pro：谷歌已确认即将推出

AIbase将持续跟踪苹果 Siri 升级进展及大模型在终端侧的落地表现。这场由参数规模、推理速度、隐私保护共同定义的 AI 竞赛，正越来越接近消费者日常使用场景。谁能最终胜出，拭目以待。

via AI新闻资讯 (author: AI Base)

Elevated errors for Claude Code in Slack

May 26, 01:56 UTC
Investigating - We are currently investigating this issue.

via Claude Status - Incident History

最高年薪44. 5 万美元！OpenAI高薪招聘安全研究员

人工智能巨头OpenAI日前发布了一则引人注目的安全研究员招聘启事。该岗位开出了29. 5 万至44. 5 万美元（约合人民币 214 万至 323 万元）的丰厚年薪，旨在吸引全球顶尖技术人才，为AI系统的递归式自我改进做足准备。

独特选才标准：要求具备良好品位

与传统的纯技术密集型岗位不同，OpenAI在招聘要求中特别注明，应聘者需要具备“良好的品位与策略判断”。这一罕见的表述恰恰反映了安全团队的工作性质，即不仅依赖工程硬实力，更考验人在面对复杂情况时的综合决断力。

公司希望借此培养出能够突破现有思维框架、提前识别尚未完全显现风险的优秀工程师。这意味着从业者需要审慎权衡安全上的利弊得失，合理分配任务优先级，并设计出兼具技术正确性、社会和伦理合理性的高标准方案。

紧盯自动化进程与评估未来演化

该岗位的核心职责并不仅限于构建安全系统，更需要高瞻远瞩地评估这些AI系统未来的演化方向。研究人员需要具备极强的前瞻性，在危机尚未爆发前就制定好应对策略。

此外，入职的研究人员可能还需要负责“追踪技术人员的自动化进程”。这其中就包括了需要严密衡量和评估公司内部人工智能代码工具的实际使用程度，以确保整个技术演进过程处于绝对可控的安全边界之内。

via AI新闻资讯 (author: AI Base)

xAI 推出 Grok Build：进驻终端的“全能 AI 编程智能体”

5 月 25 日，xAI 正式发布了其全新的 AI 编程智能体 Grok Build，现已面向所有 SuperGrok 及 X Premium Plus 订阅用户开启 Beta 测试。这款工具不仅是一个简单的代码助手，而是一款集成在终端（CLI）中的深度工程化智能体，旨在通过自动化流程实现复杂的软件开发任务。

Grok Build 的核心架构与功能

Grok Build 被设计为能够直接嵌入开发者的日常工作流，其核心亮点包括：

● Plan Mode（规划模式）： 针对复杂开发任务，Grok Build 可自动生成详细的执行计划。开发者可以在任务执行前查看、评论、修改甚至完全重写该计划，确保每一行变更都经过严格的“评审-批准”链路，产出更安全、可控的代码。
● Imagine 工具集成： 在开发过程中，用户可直接调用 Imagine 工具，利用 AI 生成图片与视频资源，满足项目中的多模态素材需求。
● 命令行（CLI）赋能： ● 高度自动化： 支持通过命令行直接构建复杂的自动化流程或编排器。 ● 并行协作： 对于超大规模任务，Grok Build 能自动拆解并指派多个子智能体（Sub-agents）并行处理，极大提升了处理大型仓库（Repo）效率。 ● 生态兼容： 它能够“开箱即用”地兼容开发者现有的 AGENTS.md、插件、钩子（hooks）、技能及 MCP 服务器，即刻适配现有工作惯例。

“AI+软件工程”的新范式

与传统的 AI 代码助手不同，Grok Build 强调的是工程化的全链路控制。其特有的“ headless mode（无头模式）”允许其在脚本和自动化流程中运行，并全面支持 ACP（Agent Client Protocol，智能体客户端协议），这意味着开发者可以将其作为底层逻辑，构建属于自己的 AI 代理应用。

目前，Grok Build 已在特斯拉的软件开发中展露锋芒，包括 FSD（全自动驾驶） 系统的开发以及即将面世的 Cybercab 自动驾驶车辆项目中，已有资深工程师确认其被广泛应用于解决复杂的工程难题。

如何上手？

现有订阅用户可以通过简单的命令一键安装并使用：

curl -fsSL [https://x.ai/cli/install.sh](https://x.ai/cli/install.sh) | bash

xAI 表示，Grok Build 目前仍处于 Beta 阶段，鼓励用户通过 CLI 输入 /feedback 实时反馈 Bug 或功能需求。随着此次发布的落地，xAI 正加速将 AI 推向工程研发的最前线，试图将开发者从繁重的重复性编码工作中彻底解放。

via AI新闻资讯 (author: AI Base)

Anthropic 正酝酿公开上线最强模型 Mythos，AI 赛博安全进入“深水区”

via AI新闻资讯 (author: AI Base)

Anthropic 正酝酿公开上线最强模型 Mythos，AI 赛博安全进入“深水区”

随着 Anthropic 近期在后端代码中的频频动作，代号为 “claude-mythos-1-preview” 的模型正处于公开上线的前夜。这款曾因“能力过强”而遭到严格限制的前沿模型，正逐渐从实验室的受控环境走向开发者工具，这标志着 AI 安全治理迈出了从“防御性限制”到“主动式工具化”的关键一步。

上下文 150 万 tokens！OpenAI未官宣新旗舰GPT-5.6意外曝光

多名开发者近日在OpenAI Codex的后端日志中，意外发现了尚未正式官宣的全新大模型“GPT-5.6”。这款内部代号为“iris-alpha”的新旗舰展现出了惊人的技术参数，并有望于今年6月正式发布。

150万超长上下文打破纪录

在本次曝光的GPT-5.6系列模型中，最引人瞩目的突破当属其高达150万token的超长上下文窗口。相比于现行的GPT-5.5API，新模型的全文本处理上限直接拉高了近43%，这意味着它能够轻松驾驭超长合同、大型代码库以及复杂的跨步骤长期任务。

开发者在辅助工具OpenCode中对其进行了极端真实世界测试。结果证实，当输入数据达到90万个token时，该模型依然可以保持流畅响应，甚至能够完美处理超过105万个token的超负荷请求。同时曝光的还有ember-alpha和beacon-alpha两个神秘版本，但其具体定位尚不明确。

商用级前端生成引发行业巨震

除了强大的文本容纳能力，GPT-5.6在前端界面生成能力上同样带来了颠覆性的进化。爆料截图显示，在几乎没有任何详细提示词的前提下，该模型直接自主生成了一款名为Lumen Notes的极简记事应用界面。

该界面展现出了极为成熟的栅格布局、克制的配色策略以及清晰的字体层级，这意味着大模型已不再停留在单纯的写代码阶段，而是具备了直接输出商用级前端产品的能力。随着GPT-5.6的提上日程，克劳德、双子座以及xAI的Grok等竞争对手也将于6月密集发布新品，全球AI科技巨头的新一轮遭遇战已一触即发。

via AI新闻资讯 (author: AI Base)

欧洲央行紧急会议应对 Anthropic 新 Claude Mythos 带来的网络安全威胁

近日，欧洲央行召开了紧急会议，讨论因 Anthropic 公司推出的新 AI 模型 Claude Mythos 所引的网络安全隐患。《金融时报》报道，这一会议是在当地时间周二召，主要目应对 Claude Mythos 对全球金融系统所带来的潜在威胁。

Claude Mythos 被认为能够发现金融机构信息系统中的高危漏洞，这让全球监管十分忧虑欧洲央行的副主席兰克・尔德森在采访中指出，网络安全问题已被讨论多年，但随着 AI 技术的发展，解决这些问题的紧迫性愈发明显。他强调，以往的应对措施速度较慢，现在必须加快步伐。

会议上，埃尔德森对欧洲银行未能获得 Claude Mythos 的使用权限表示遗憾，并希望已经使用该模型的美国银行能够他们的经验和信息。特别软件补丁的部署方面，埃尔德森要求银行加快更新速度，因为一旦漏洞被曝光，恶意分很可能会迅速利用这些。

目前，全球众多金融机构已向 Anthropic 申请获得 Claude Mythos 的使用权限，以提高自身的网络安全防御能力。Anthropic 公司表示，虽然大部分使用权限主要授予美国企业，但他们也计划向其他机构提供相关的技术简报，尤其是包括金融委员会和欧盟委员会的高层。

这次临时会议反映出，面对不断变化的技术环境，全球监管机构采取更快、更有效的对措施，以确保体系的安全和稳定。时间的推移，埃尔德森强调，金融机构不能以未获得模型访问权限为借口，必须采取积极措施来防范潜在的网络攻击。

划重点：

🌐 欧洲央行召开紧急会议，应 Claude Mythos 模型带网络安全威胁。

🔍 Claude Mythos 揭示数千金融系统漏洞，全球监管机构高度警惕。

⚠️ 欧洲银行未能获得使用权限，急需加快软件补丁部署，以防范攻击。

via AI新闻资讯 (author: AI Base)

报道称Anthropic 即将发布新一代模型 Mythos，或引发安全隐忧

据科技媒体 Testingcatalog 报道，Anthropic 公司似乎正在准备公开其最新模型 Claude Mythos 的预览版。这一消息引起了泛关注，因为 thos 被是公司迄为止最大的 AI 模型之一。

根据消息来源，在 Claude 和 Claude Security 公开版本中，用户曾短暂发现了名为 “claude-mythos-1-preview” 的选项，但随后该选项被撤回。这表明，Anthropic 可能已经进入了模型的上线前测试阶段。Claude Mythos 的开发可以追溯到 4 月 7 日，官方定位其为针对计算机安全任务的前沿模型。与现有旗舰模型 Opus 4. 相比，Myos 在代码理和自主方面有了显著提升。

然而于其强能力，Anth 并未急全面开放 Myos。公司此前告称，这模型能够自动具备专业准的网络攻击手段，发布可能会对数字基础设施带来严重风险。这一潜在胁让许多人对 Mythos 的公开发布充满了担忧。

值得注意的是，部分用户曾在 Code 的公共版本中短暂看到启用 Mythos 的选项，而 Claude Security 中也出现了同名模型。不过，截至目前，Anthropic 尚未正式宣布具体的公开发布时间。

与此同时，Anthropic 确认正在推进为 “Glass” 的新项目，该项目旨在与其他公司联合保护全球关键软件系统防止 AI 动的漏洞利用。该使用尚未的 Claude Mythos 预览版，并已与多达家组织伙伴合作。Anthropic 展示了一个源漏洞面板，用于汇总 thos 预版发现的不同严重等级的漏洞。

via AI新闻资讯 (author: AI Base)

GPT-5.6 惊现后端日志：150 万上下文窗口，大模型乱战六月

via AI新闻资讯 (author: AI Base)

GPT-5.6 惊现后端日志：150 万上下文窗口，大模型乱战六月

近日，多名开发者在 OpenAI Codex 后端日志中捕捉到了一系列未官宣模型的踪迹，其中代号为 "iris-alpha" 的 GPT-5.6 模型凭借150万 Token 的超大上下文窗口，成为行业焦点。

13 小时前

Anthropic模型震动金融圈欧洲央行紧急开会要求升级网络防御

欧洲央行已召集多家银行于周二召开会议，讨论最新人工智能模型暴露出的网络安全风险，这家中央银行预计将敦促其他银行加快强化IT系统防护的步伐。欧洲央行计划在会上强调Anthropic的Claude Mythos Preview以及类似AI模型揭示了金融系统面临的严重威胁，同时敦促已使用这类最新技术的多家美国银行，与尚未获得相关技术访问权限的欧洲同行共享信息。欧洲央行执行委员会成员弗兰克·埃尔德森告诉媒体，“多年来，我们一直在与银行讨论网络安全的一系列问题，这些问题如今依然存在。但鉴于人工智能的发展速度，这些问题必须更快解决。”

—— 财联社

via 风向旗参考快讯 - Telegram Channel

教宗良十四世发布首份通谕：AI 须服务人类，不可集中权力

教宗良十四世于 5 月 25 日发布首份通谕《人类的伟大》（Magnifica humanitas）。在通谕发布仪式上，梵蒂冈打破惯例，邀请人工智能独角兽 Anthropic 联合创始人克里斯托弗·奥拉参加。教皇借此机会与硅谷模型制造者代表同台，直接施加道德约束。

通谕指出，技术从来不是中立的，人工智能必须服务于共同利益，而不应被少数人垄断，以免拉大“数字革命”中的鸿沟。教皇在通谕中痛批埃隆·马斯克与彼得·蒂尔等硅谷领袖推崇的超人类主义愿景，谴责在 AI 研发中将特定人群判定为低效、无用与多余的精英主义倾向。

Vatican News

🌸 在花频道 · 备用频道 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel

硅谷把人工智能“推销”到教皇利奥十四世面前

via cnBeta.COM - 中文业界资讯站 (author: 稿源：cnBeta.COM)

在罗马一个阳光明媚的春日，法国多米尼克会神父埃里克·萨洛比尔带着一支特殊代表团穿过人潮涌动的圣彼得广场，走向教皇利奥十四世。随行者中有来自Meta、Google和亚马逊的代表，他们此行的议题是“人工智能时代的儿童保护”。与教皇的会面本身很短暂，但随后在罗马市中心法国驻教廷大使馆举行的闭门会议却持续了数小时。在这场长时间会谈中，梵蒂冈传播部长保罗·鲁菲尼与科技公司代表面对面，就一个正在塑造利奥十四世年轻教宗任期的核心问题展开辩论：作为世界上最古老的道德权威之一，天主教会应当如何评判硅谷正全力打造的前沿技术？…

硅谷把人工智能“推销”到教皇利奥十四世面前

Elevated error rates on Opus 4.7

May 25, 10:32 UTC
Monitoring - We had an elevated error rate on Opus 4.7 from 6:30 UTC until 10:30 UTC

via Claude Status - Incident History