https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
OpenAI Codex 新增“锁屏运行”功能:Mac 桌面代理进入自动化新阶段

5 月 21 日至 22 日,OpenAI 正式宣布其桌面代理产品 Codex 新增 “Locked Use”(锁屏运行) 功能。该功能打破了传统 AI 代理必须在“解锁且屏幕常亮”状态下工作的限制,允许开发者在 Mac 锁定或息屏状态下,依然能够通过远程指令操控本地应用程序。

一、核心突破:不再需要“看守”你的电脑

在过去,执行长时长的复杂工程任务(如大型代码仓库编译、GUI 自动化测试)时,开发者往往需要通过“咖啡因”插件或外接假显示器来强行维持 Mac 处于唤醒状态。

Locked Use 的发布改变了这一现状:

● 后台自动化: 用户可以从手机发送任务指令,Codex 即可在 Mac 锁屏状态下自动执行 UI 操作、调整设置或运行桌面应用流程。
● 开发体验优化: 这一功能极大地提升了“多小时任务”的可行性,开发者无需再为维持电脑唤醒而“看守”设备。

二、技术实现与安全机制

为了在保证系统安全的前提下实现这一功能,OpenAI 采取了严谨的权限与约束架构:

● Apple 授权插件: 该功能通过一个特定的 Apple 授权插件实现。它并非一个通用的远程解锁路径,而是仅允许 Codex 代理在受限的行为约束下执行特定任务。
● 严格的权限管理: 运行该功能需要用户明确授予 屏幕录制(Screen Recording)辅助功能(Accessibility) 权限。
● 行为“护栏”: ● 禁区限制: 该功能明确限制了代理对系统的底层控制,例如无法自动化控制终端(Terminal)或 Codex 自身,从而有效规避了恶意利用或失控风险。 ● 地理限制: 出于对区域性法律法规及 AI 智能体监管政策的考量,该功能在发布初期不适用于欧洲经济区(EEA)、英国及瑞士● 操作约束: 若 MacBook 处于合盖状态(触发特定的休眠模式),该功能将无法继续工作。

三、行业视角:桌面代理安全的新命题

Codex 这一功能的推出,标志着桌面级 AI 代理正从“云端协作”走向“深度系统集成”。业内专家指出,这也引发了企业端对终端安全的新思考:

1. 合规性挑战: 这种能够绕过锁屏进行操作的“特权代理”,对于企业信息安全管理(尤其是涉及生产凭证的开发机器)提出了更高的审计与监控要求。
2. 信任模型升级: 操作系统如何为这类“信任代理”设定更精细化的权限等级,将成为未来 macOS 等桌面系统迭代的核心看点。
3. 安全审计需求: 目前,开发者仍无法完全“黑盒”化该进程。未来,如何提供操作日志回溯或 session 监控,将是企业大规模部署该类 AI 工具时的关键门槛。

四、功能适用范围

● 适用平台: 仅限安装了 Codex 桌面代理的 macOS 设备。
● 配置方式: 用户可在 Codex 设置界面中找到“Locked Use”选项进行开启。
● 场景建议: 主要面向重现 GUI 界面 Bug、自动化调整桌面应用配置、以及无需人工干预的离线任务处理。

OpenAI 此次更新,不仅进一步夯实了其在 AI 辅助开发领域的领跑地位,也为未来“无感化”的 AI 办公体验探索了一条高标准、强监管的落地路径。

via AI新闻资讯 (author: AI Base)
Degraded Performance for Agent Sessions

May 26, 03:04 UTC
Investigating - We are monitoring a service degradation affecting Agents sessions in IDE

via Cursor Status - Incident History
苹果 Siri 重磅升级:1.2 万亿参数谷歌定制模型“掌脑”,本地运行速度成关键

北京时间 5 月 26 日,据多家媒体援引知情人士消息,苹果并非简单将 Gemini 集成到 Siri 中,而是正在采用一款由谷歌定制的1.2 万亿参数大型语言模型,作为下一代 Siri 核心 overhaul 的“大脑”。

这一规模远超当前主流移动端模型,引发业界高度关注。

模型规模碾压:1.2T vs Gemini 3.5 Flash 300B

据估算,Gemini 3.5 Flash 的参数量约为 3000 亿,而苹果此次采用的定制模型达到1.2 万亿参数,规模显著更大。AIbase分析指出,如此庞大的模型若能高效部署,将为 Siri 带来更强的理解、推理和复杂任务处理能力,尤其在多模态交互和上下文理解方面有望实现质的飞跃。

性能与速度:本地响应是最大考验

尽管模型参数激增,但苹果一贯注重用户隐私与实时性。报道强调,简单查询预计将优先在本地设备上运行。这意味着苹果必须解决大模型在 iPhone 等终端上的高效推理难题——既要保证回答日常问题的速度足够快,又要兼顾功耗和发热控制。

AIbase认为,模型“够大”并不必然等于“够好”。在移动场景下,延迟、能耗和准确率的平衡才是成败关键。苹果是否能在 1.2T 参数模型上实现高效本地 / 混合部署,将直接决定这次 Siri overhaul 的用户体验。

下半年 AI 大战一触即发

随着苹果在 WWDC 上即将展示 Apple Intelligence 与 Gemini 的深度融合,全球 AI 巨头竞赛进入新阶段。未来几个月值得期待的重磅更新包括:

● WWDC:Apple Intelligence 全面亮相,Siri 与 Gemini 定制模型结合
● GPT-5.6:OpenAI 下一代模型进展
● Sonnet 4.8 / Opus 4.8:Anthropic 可能同步迭代
● Gemini 3.5 Pro:谷歌已确认即将推出

AIbase将持续跟踪苹果 Siri 升级进展及大模型在终端侧的落地表现。这场由参数规模、推理速度、隐私保护共同定义的 AI 竞赛,正越来越接近消费者日常使用场景。谁能最终胜出,拭目以待。

via AI新闻资讯 (author: AI Base)
Elevated errors for Claude Code in Slack

May 26, 01:56 UTC
Investigating - We are currently investigating this issue.

via Claude Status - Incident History
最高年薪44. 5 万美元!OpenAI高薪招聘安全研究员

人工智能巨头OpenAI日前发布了一则引人注目的安全研究员招聘启事。该岗位开出了29. 5 万至44. 5 万美元(约合人民币 214 万至 323 万元)的丰厚年薪,旨在吸引全球顶尖技术人才,为AI系统的递归式自我改进做足准备。

独特选才标准:要求具备良好品位

与传统的纯技术密集型岗位不同,OpenAI在招聘要求中特别注明,应聘者需要具备“良好的品位与策略判断”。这一罕见的表述恰恰反映了安全团队的工作性质,即不仅依赖工程硬实力,更考验人在面对复杂情况时的综合决断力。

公司希望借此培养出能够突破现有思维框架、提前识别尚未完全显现风险的优秀工程师。这意味着从业者需要审慎权衡安全上的利弊得失,合理分配任务优先级,并设计出兼具技术正确性、社会和伦理合理性的高标准方案。

紧盯自动化进程与评估未来演化

该岗位的核心职责并不仅限于构建安全系统,更需要高瞻远瞩地评估这些AI系统未来的演化方向。研究人员需要具备极强的前瞻性,在危机尚未爆发前就制定好应对策略。

此外,入职的研究人员可能还需要负责“追踪技术人员的自动化进程”。这其中就包括了需要严密衡量和评估公司内部人工智能代码工具的实际使用程度,以确保整个技术演进过程处于绝对可控的安全边界之内。

via AI新闻资讯 (author: AI Base)
xAI 推出 Grok Build:进驻终端的“全能 AI 编程智能体”

5 月 25 日,xAI 正式发布了其全新的 AI 编程智能体 Grok Build,现已面向所有 SuperGrok 及 X Premium Plus 订阅用户开启 Beta 测试。这款工具不仅是一个简单的代码助手,而是一款集成在终端(CLI)中的深度工程化智能体,旨在通过自动化流程实现复杂的软件开发任务。

Grok Build 的核心架构与功能

Grok Build 被设计为能够直接嵌入开发者的日常工作流,其核心亮点包括:

● Plan Mode(规划模式): 针对复杂开发任务,Grok Build 可自动生成详细的执行计划。开发者可以在任务执行前查看、评论、修改甚至完全重写该计划,确保每一行变更都经过严格的“评审-批准”链路,产出更安全、可控的代码。
● Imagine 工具集成: 在开发过程中,用户可直接调用 Imagine 工具,利用 AI 生成图片与视频资源,满足项目中的多模态素材需求。
● 命令行(CLI)赋能: ● 高度自动化: 支持通过命令行直接构建复杂的自动化流程或编排器。 ● 并行协作: 对于超大规模任务,Grok Build 能自动拆解并指派多个子智能体(Sub-agents)并行处理,极大提升了处理大型仓库(Repo)效率。 ● 生态兼容: 它能够“开箱即用”地兼容开发者现有的 AGENTS.md、插件、钩子(hooks)、技能及 MCP 服务器,即刻适配现有工作惯例。

“AI+软件工程”的新范式

与传统的 AI 代码助手不同,Grok Build 强调的是工程化的全链路控制。其特有的“ headless mode(无头模式)”允许其在脚本和自动化流程中运行,并全面支持 ACP(Agent Client Protocol,智能体客户端协议),这意味着开发者可以将其作为底层逻辑,构建属于自己的 AI 代理应用。

目前,Grok Build 已在特斯拉的软件开发中展露锋芒,包括 FSD(全自动驾驶) 系统的开发以及即将面世的 Cybercab 自动驾驶车辆项目中,已有资深工程师确认其被广泛应用于解决复杂的工程难题。

如何上手?

现有订阅用户可以通过简单的命令一键安装并使用:

curl -fsSL [https://x.ai/cli/install.sh](https://x.ai/cli/install.sh) | bash

xAI 表示,Grok Build 目前仍处于 Beta 阶段,鼓励用户通过 CLI 输入 /feedback 实时反馈 Bug 或功能需求。随着此次发布的落地,xAI 正加速将 AI 推向工程研发的最前线,试图将开发者从繁重的重复性编码工作中彻底解放。

via AI新闻资讯 (author: AI Base)
上下文 150 万 tokens!OpenAI未官宣新旗舰GPT-5.6意外曝光

多名开发者近日在OpenAI Codex的后端日志中,意外发现了尚未正式官宣的全新大模型“GPT-5.6”。这款内部代号为“iris-alpha”的新旗舰展现出了惊人的技术参数,并有望于今年6月正式发布。

150万超长上下文打破纪录

在本次曝光的GPT-5.6系列模型中,最引人瞩目的突破当属其高达150万token的超长上下文窗口。相比于现行的GPT-5.5API,新模型的全文本处理上限直接拉高了近43%,这意味着它能够轻松驾驭超长合同、大型代码库以及复杂的跨步骤长期任务。

开发者在辅助工具OpenCode中对其进行了极端真实世界测试。结果证实,当输入数据达到90万个token时,该模型依然可以保持流畅响应,甚至能够完美处理超过105万个token的超负荷请求。同时曝光的还有ember-alpha和beacon-alpha两个神秘版本,但其具体定位尚不明确。

商用级前端生成引发行业巨震

除了强大的文本容纳能力,GPT-5.6在前端界面生成能力上同样带来了颠覆性的进化。爆料截图显示,在几乎没有任何详细提示词的前提下,该模型直接自主生成了一款名为Lumen Notes的极简记事应用界面。

该界面展现出了极为成熟的栅格布局、克制的配色策略以及清晰的字体层级,这意味着大模型已不再停留在单纯的写代码阶段,而是具备了直接输出商用级前端产品的能力。随着GPT-5.6的提上日程,克劳德、双子座以及xAI的Grok等竞争对手也将于6月密集发布新品,全球AI科技巨头的新一轮遭遇战已一触即发。

via AI新闻资讯 (author: AI Base)
欧洲央行紧急会议应对 Anthropic 新 Claude Mythos 带来的网络安全威胁

近日,欧洲央行召开了紧急会议,讨论因 Anthropic 公司推出的新 AI 模型 Claude Mythos 所引的网络安全隐患。《金融时报》报道,这一会议是在当地时间周二召,主要目应对 Claude Mythos 对全球金融系统所带来的潜在威胁。

Claude Mythos 被认为能够发现金融机构信息系统中的高危漏洞,这让全球监管十分忧虑欧洲央行的副主席兰克・尔德森在采访中指出,网络安全问题已被讨论多年,但随着 AI 技术的发展,解决这些问题的紧迫性愈发明显。他强调,以往的应对措施速度较慢,现在必须加快步伐。

会议上,埃尔德森对欧洲银行未能获得 Claude Mythos 的使用权限表示遗憾,并希望已经使用该模型的美国银行能够他们的经验和信息。特别软件补丁的部署方面,埃尔德森要求银行加快更新速度,因为一旦漏洞被曝光,恶意分很可能会迅速利用这些。

目前,全球众多金融机构已向 Anthropic 申请获得 Claude Mythos 的使用权限,以提高自身的网络安全防御能力。Anthropic 公司表示,虽然大部分使用权限主要授予美国企业,但他们也计划向其他机构提供相关的技术简报,尤其是包括金融委员会和欧盟委员会的高层。

这次临时会议反映出,面对不断变化的技术环境,全球监管机构采取更快、更有效的对措施,以确保体系的安全和稳定。时间的推移,埃尔德森强调,金融机构不能以未获得模型访问权限为借口,必须采取积极措施来防范潜在的网络攻击。

划重点:

🌐 欧洲央行召开紧急会议,应 Claude Mythos 模型带网络安全威胁。

🔍 Claude Mythos 揭示数千金融系统漏洞,全球监管机构高度警惕。

⚠️ 欧洲银行未能获得使用权限,急需加快软件补丁部署,以防范攻击。


via AI新闻资讯 (author: AI Base)
报道称Anthropic 即将发布新一代模型 Mythos,或引发安全隐忧

据科技媒体 Testingcatalog 报道,Anthropic 公司似乎正在准备公开其最新模型 Claude Mythos 的预览版。这一消息引起了泛关注,因为 thos 被是公司迄为止最大的 AI 模型之一。

根据消息来源,在 Claude 和 Claude Security 公开版本中,用户曾短暂发现了名为 “claude-mythos-1-preview” 的选项,但随后该选项被撤回。这表明,Anthropic 可能已经进入了模型的上线前测试阶段。Claude Mythos 的开发可以追溯到 4 月 7 日,官方定位其为针对计算机安全任务的前沿模型。与现有旗舰模型 Opus 4. 相比,Myos 在代码理和自主方面有了显著提升。

然而于其强能力,Anth 并未急全面开放 Myos。公司此前告称,这模型能够自动具备专业准的网络攻击手段,发布可能会对数字基础设施带来严重风险。这一潜在胁让许多人对 Mythos 的公开发布充满了担忧。

值得注意的是,部分用户曾在 Code 的公共版本中短暂看到启用 Mythos 的选项,而 Claude Security 中也出现了同名模型。不过,截至目前,Anthropic 尚未正式宣布具体的公开发布时间。

与此同时,Anthropic 确认正在推进为 “Glass” 的新项目,该项目旨在与其他公司联合保护全球关键软件系统防止 AI 动的漏洞利用。该使用尚未的 Claude Mythos 预览版,并已与多达家组织伙伴合作。Anthropic 展示了一个源漏洞面板,用于汇总 thos 预版发现的不同严重等级的漏洞。

via AI新闻资讯 (author: AI Base)
Anthropic模型震动金融圈 欧洲央行紧急开会要求升级网络防御

欧洲央行已召集多家银行于周二召开会议,讨论最新人工智能模型暴露出的网络安全风险,这家中央银行预计将敦促其他银行加快强化IT系统防护的步伐。欧洲央行计划在会上强调Anthropic的Claude Mythos Preview以及类似AI模型揭示了金融系统面临的严重威胁,同时敦促已使用这类最新技术的多家美国银行,与尚未获得相关技术访问权限的欧洲同行共享信息。欧洲央行执行委员会成员弗兰克·埃尔德森告诉媒体,“多年来,我们一直在与银行讨论网络安全的一系列问题,这些问题如今依然存在。但鉴于人工智能的发展速度,这些问题必须更快解决。”

—— 财联社

via 风向旗参考快讯 - Telegram Channel
教宗良十四世发布首份通谕:AI 须服务人类,不可集中权力

教宗良十四世于 5 月 25 日发布首份通谕《人类的伟大》(Magnifica humanitas)。在通谕发布仪式上,梵蒂冈打破惯例,邀请人工智能独角兽 Anthropic 联合创始人克里斯托弗·奥拉参加。教皇借此机会与硅谷模型制造者代表同台,直接施加道德约束。

通谕指出,技术从来不是中立的,人工智能必须服务于共同利益,而不应被少数人垄断,以免拉大“数字革命”中的鸿沟。教皇在通谕中痛批埃隆·马斯克与彼得·蒂尔等硅谷领袖推崇的超人类主义愿景,谴责在 AI 研发中将特定人群判定为低效、无用与多余的精英主义倾向。

Vatican News

🌸 在花频道 · 备用频道 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
Elevated error rates on Opus 4.7

May 25, 10:32 UTC
Monitoring - We had an elevated error rate on Opus 4.7 from 6:30 UTC until 10:30 UTC

via Claude Status - Incident History
国家标准委发布《AI伦理安全指引1.0》,为大模型落地装上“安全闸”

近日,全国网络安全标准化技术委员会正式发布《人工智能应用伦理安全指引1.0》。这份重磅文件由阿里、华为、深度求索(DeepSeek)等头部企业及科研单位联合起草,标志着我国人工智能伦理安全治理体系从“顶层倡议”正式迈向“技术标准落位”的新阶段。

文件核心定位:

该指引是一份原则性、参考性的技术文件,旨在为人工智能产业链上的各主体提供一套可执行的伦理安全框架,以应对当前AI应用中日益突出的安全挑战。


指引的三大维度:全生命周期安全闭环

《指引》明确将人工智能的生命周期拆解为应用开发、服务提供、应用使用三个关键层面,并针对各环节提出了差异化的安全要求:

● 开发层:源头治理。 明确要求开发者在模型训练数据清理、模型架构安全性设计及算力环境配置中嵌入伦理审查机制。
● 服务层:过程管控。 重点针对当下大模型普遍存在的“AI 幻觉”问题,要求服务提供方必须具备有效的风险监测与管控手段,确保输出内容的真实性与一致性。
● 使用层:用户边界。 为应用终端的合法合规使用划定界限,保护用户隐私,防止技术滥用。

为什么这份《指引》至关重要?

在业内人士看来,这份文件的落地具有深远的产业价值:

1. 责任主体清晰化: 过去,当 AI 出现内容失控或伦理纠纷时,责任往往模糊。该指引通过明确各环节规范,倒逼企业在模型上线前必须履行安全“预验收”责任。
2. 化解“幻觉”黑洞: 针对人工智能输出不可控(幻觉)的行业痛点,《指引》首次从标准层面提出了管控要求,这将直接推动企业研发更稳健、具备事实校验能力的底层模型。
3. 构建安全生态: 阿里、华为、深度求索等企业的参与,体现了行业对“安全是AI发展前提”的共识。这不仅有利于完善国内人工智能治理体系,更提升了中国 AI 企业在全球技术治理话语权中的专业度。

行业影响:从“野蛮生长”向“合规深耕”转型

随着《人工智能应用伦理安全指引1.0》的发布,AI 产业正迎来新的拐点:

● 合规成“入场券”: 对于致力于 AI 应用的企业而言,伦理安全审计将成为项目上线流程中的硬性标准。
● 技术迭代新方向: 能够有效抑制幻觉、具备强大伦理安全保障的底座模型,将比单纯拼参数规模的模型更受市场青睐。

业内普遍认为,这份指引不仅是对当前 AI 治理短板的及时补齐,更是为国内人工智能产业的长期可持续发展夯实了底座。对于广大从业者而言,这意味着 AI 的开发与应用将不再是脱缰的野马,而是在法律与伦理的轨道上,向更高质量的“智能社会”迈进。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]