ChatGPT / AI新闻聚合

OpenAI基金会拿出2.5亿美元研究AI如何冲击工作和收入

OpenAI基金会准备投入2.5亿美元，研究AI对就业和经济的影响，支持短期内可能受到冲击的工人和社区，并探索如何更广泛地分配AI带来的经济收益。据The Information报道，这笔资金将用于推动AI经济影响研究。路透社也报道称，这是OpenAI基金会在“AI经济影响”方向的首笔此类承诺，资金形式包括拨款、合作项目，以及基金会直接参与的项目。对普通人来说，更现实的问题不是“AI会不会替代所有人”，而是公司引入AI以后，哪些岗位会先被重组，哪些技能需要重新培训，地方社区和职业教育机构能不能跟上。 …

3 小时前

AI 独角兽 Cognition 完成 10 亿美元融资，估值飙升至 260 亿美元

5 月 27 日，自动驾驶 AI 软件工程师“Devin”的母公司 Cognition 正式宣布完成新一轮超过 10 亿美元 的融资。此次融资前的估值即高达 250 亿美元，投后估值达到 260 亿美元。

一、资本市场的“疯狂”跳跃

仅在八个月前（2025 年 9 月），Cognition 完成了 4 亿美元融资，当时的投后估值约为 102 亿美元。短短八个月内，其估值增长了超过 150 亿美元，这一跨越式增长不仅展示了资本对 AI 编码赛道的极度追捧，更凸显了 Cognition 在行业内的头部地位。

本轮融资由 Lux Capital、General Catalyst 和 8VC 领投，Founders Fund 等多家既有投资机构跟投，同时吸引了 Ribbit Capital 等新晋投资者入局。

二、破局者的底气：客户与营收双增长

在 OpenAI、Anthropic 等大模型厂商纷纷下场布局编程工具（如 Claude Code、Codex）的市场环境下，Cognition 的独立生存能力备受关注。然而，公司给出的成绩单极具说服力：

● 企业级客户： 凭借 Devin 的出色表现，Cognition 成功锁定了梅赛德斯-奔驰、NASA、高盛（Goldman Sachs）及桑坦德银行（Santander）等全球顶尖企业客户。
● 爆发式营收： 目前，Cognition 的年化收入运行率（ARR）已达到 4.92 亿美元。随着企业级用户对 Devin 的深度依赖，过去六个月内，该平台的企业端使用量保持了每月 50% 的高速增长。
● 技术整合： Cognition 此前收购了 Windsurf 的剩余资产，进一步强化了其在 AI 编码领域的底层技术与人才储备。

三、行业信号：AI 编码的“独立战场”

Cognition 的此轮融资向市场释放了一个强力信号：AI 软件工程领域并非仅是大模型厂商的附属品。

行业此前担忧 AI 代码生成市场会被 OpenAI、Google 等巨头模型厂商“吞噬”。但 Cognition 的实践证明，通过高度专注的 AI 智能体产品（Agentic AI），并深度整合企业级复杂工作流，初创公司同样能构建出高壁垒的商业闭环。

对于投资者而言，Cognition 代表了 AI 落地最核心的价值——直接生产力转化。Devin 不仅仅是一个辅助补全代码的工具，而是一个能够独立完成软件开发生命周期任务的“AI 工程师”，这种能够直接为企业削减人力成本、提升开发效能的解决方案，正是当前 AI 泡沫浪潮下，资本最渴望捕捉的“硬通货”。

via AI新闻资讯 (author: AI Base)

4 小时前

好抓马！AI删光2.8万行代码，干崩后台还编造了一份故障修复报告

via cnBeta.COM - 中文业界资讯站 (author: 稿源：智东西)

好抓马！AI删光2.8万行代码，干崩后台还编造了一份故障修复报告

Agent IDE又出“车祸现场”！近日，一名开发者在Reddit发帖称，运行在Agent IDE中的Gemini 3.5在一次仅涉及“8处认证漏洞修复”的任务中，误删了28745行原本正常运行的代码、改动340个文件，还错误修改了Firebase路由配置，导致整个系统后台持续404长达33分钟。离谱的是，事故发生后，Gemini还生成了一份“恢复成功”报告，自称已经修复线上故障，并伪造了多轮AI会诊记录和事故复盘文件。开发者随后核查发现，所谓“恢复成功”的构建任务其实早已被他亲手取消，真正完成恢复的是他自己手动执行的回滚操作。…

4 小时前

中外AI对决国产三强只能争夺全球第五

SuperCLUE最新中文大模型测评结果出炉，全球第一梯队被海外模型牢牢占据，国产表现最好的三款模型，只能在全球第五名的位置上激烈竞争。本次测评覆盖21款国内外主流模型，测评集包括六大任务：数学推理、科学推理、代码生成、智能体（任务规划）、精确指令遵循、幻觉控制，共492题。

Gemini、GPT-5.5、Claude-Opus、Gemini-Flash四款海外模型稳居前四，形成难以撼动的第一梯队。

DeepSeek-V4-Pro、Qwen3.7-Max、豆包Seed 2.0 Pro三款国产模型分数非常接近，组成国内第一梯队，全球排名集中在第五位附近，成为国产第一集团。

虽然整体仍有差距，但国产模型进步很明显。代码生成项目中，Qwen3.7-Max得分仅次于海外头部模型，差距不到2分。数学推理、科学推理等项目，国产模型也多次冲进全球前列。

性价比方面，国产模型优势突出，多款产品进入高性价比区间，用更低成本实现接近头部的效果。推理效能上，海外模型仍垄断高效能区，国产模型多处在中低区间，还有提升空间。

整体来看，国产大模型正在快速追赶，但全球第一梯队的格局暂时没变。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：快科技)

4 小时前

国家大基金领投DeepSeek首轮融资投前估值450亿美元

via cnBeta.COM - 中文业界资讯站 (author: 稿源：财经AI湃)

国家大基金领投DeepSeek首轮融资投前估值450亿美元

《财经》获悉，近期，AI（人工智能）大模型公司DeepSeek(深度求索)首轮融资洽谈已接近尾声。参与交易谈判的投资人称，本轮融资由国家集成电路产业投资基金（简称“国家大基金”）领投，数家市场化投资机构也在谈判名单上。 DeepSeek的模型迭代需要持续投入大规模训练算力，充足资金是支撑这一长周期投入的重要来源今年4月以来，一级市场情绪高涨，DeepSeek成为炙手可热的投资标的，一名接近交易人士称，“所有人都想接触（DeepSeek），但没有一个人保证百分百投进去。”不到最后一刻，参投方和投资金额都…

5 小时前

伊利诺伊州通过历史性人工智能法案要求对科技巨头进行第三方安全审计

via cnBeta.COM - 中文业界资讯站 (author: 稿源：cnBeta.COM)

伊利诺伊州通过历史性人工智能法案要求对科技巨头进行第三方安全审计

伊利诺伊州议会于本周三通过了一项里程碑式法案，如果州长签署生效，该法案将为监管美国顶级人工智能公司设立新标准。这项编号为SB 315的法案在众议院以110票赞成、0票反对的结果获得通过，参议院也于周四以52票对5票通过该法案。目前立法机构有30天时间将法案提交给州长JB普利茨克，而后者已表示将签署这项法案。该法案借鉴了加利福尼亚州和纽约州现有的立法条款，要求像OpenAI和Anthropic这样的前沿人工智能公司制定、公布并每年更新应对其AI模型可能带来的严重或灾难性风险的计划。更重要的是，法案还将强…

5 小时前

Codex将从6月2日起下线GPT-5.2/5.3-Codex模型但GPT-5.5降智问题仍未解决

近期诸多开发者抱怨 GPT-5.5 模型存在明显的降智行为，并且问题处理过程也需要消耗更长的时间，开发者们不得不切换到旧版模型例如 GPT-5.3-Codex 或 GPT-5.4，不过现在 Codex 团队决定将从 6 月 2 日开始下线部分旧版模型，该团队仍然推荐开发者们使用 GPT-5.5 等前沿旗舰模型。

付费用户可继续使用 GPT-5.4/5.5：

对于使用 ChatGPT 登录且已经订阅付费方案，Codex 后续仅提供 GPT-5.4 和 GPT-5.5 模型，而 GPT-5.2 和 GPT-5.3-Codex 版模型将会被下线无法继续使用，如果开发者并非通过 ChatGPT 登录而是使用 API 调用则不受影响，API 平台的模型提供政策以 API 平台发布的公告为准。

而对于使用 ChatGPT 登录且使用的免费方案的用户，Codex 后续将默认使用 GPT-5.5 并且应该是没法切换的，不过本身免费版用户 Codex 使用额度非常低所以是否保留旧版模型似乎也没有太大的实际意义。

另外部分特殊模型也仍然按照原有政策提供，例如 GPT-5.3-Codex-Spark 模型，该模型提供极高的响应速度属于 OpenAI 提供的特殊模型，不受 Codex 或 ChatGPT 日常模型调整的影响，已经获得权限的开发者可以继续使用 Spark 系列模型。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：蓝点网)

6 小时前

Meta 发力订阅经济：推出“Meta One”生态，AI 与专业版增值服务全球扩张

5月27日，Meta 正式宣布在全球范围内加速推进订阅制业务。此次战略不仅涵盖了面向消费者的应用端“Plus”套餐，还通过全新的 “Meta One” 品牌，整合了 AI 算力服务、创作者变现工具及企业经营套件。这是 Meta 在广告业务之外，寻求多元化营收增长的又一里程碑。

一、消费者权益:Instagram、Facebook 与 WhatsApp 的“Plus”化

Meta 旗下的核心应用现已推出差异化的付费订阅方案，旨在满足“重度用户”对个性化与深度的需求:

● 收费架构: Instagram Plus （$3.99/月）、Facebook Plus ($3.99/月)、WhatsApp Plus ($2.99/月)。
● 核心权益: ● Instagram/Facebook: 侧重社交表达与数据洞察，如查看 Story 重播次数、Story 隐身浏览、创建不限数量的观众列表、超级心形动画互动、自定义字体与主页置顶功能等。 ● WhatsApp: 侧重个性化体验，包括应用主题切换、自定义铃声、扩展聊天置顶数量及高级贴纸包。
● 定位区别: 官方明确指出，这些“Plus”计划与现有的 Meta Verified（侧重身份验证与防冒充）并行，暂不冲突。

二、重磅布局:Meta One 统领 AI 与商业化生态

Meta 正式推出“Meta One”品牌，作为未来所有订阅服务的统一入口，并开启多项前瞻性测试:

1. AI 算力服务（Meta AI）

针对 AI 高频用户，Meta 开启了阶梯式定价测试:

● Meta One Plus （$7.99/mo）: 提供标准 AI 增值功能。
● Meta One Premium （$19.99/mo）: 解锁更高算力额度，支持复杂任务的深度逻辑推理（“思考模式”），并提供更强的图片与视频生成能力。
● 后续拓展: 这些功能将进一步适配 Meta 智能眼镜等硬件生态。

2. 专业创作者与企业方案

针对商业化诉求，Meta 推出两类订阅计划，旨在打通流量入口与经营闭环:

● Meta One Essential （$14.99/mo）: 包含 Verified 认证、防冒充保护及增强型外链表（Linksheet）。
● Meta One Advanced （$49.99/mo）: “全方位增长包”，包含信息流优先展示、搜索排名优化、自动发送“关注”邀请、Reels 深度导流工具、竞品分析数据、以及多人协作账号管理等。

三、行业深意:Meta 的增长逻辑闭环

Meta 此次全面出击订阅制，核心逻辑在于:

1. 摆脱广告依赖: 全球社交流量已趋于饱和，通过向数十亿现有用户精准提取增值价值，是 Meta 提升单用户平均收入（ARPU）的关键路径。
2. AI 商业化试水: 模仿行业领先者（如 OpenAI 的 ChatGPT Plus），将高性能计算算力与功能性价值通过订阅费实现“成本对冲与价值挖掘”。
3. 闭环式经营赋能: 对企业和创作者的高端订阅方案，本质上是提供了一种“付费增长服务”，通过算法倾斜与深度分析工具，帮助商家在 Meta 生态内实现更高效的转化。

后续部署:

Meta 计划于下个月在新加坡、危地马拉及玻利维亚率先开启 AI 订阅方案测试;针对商业与创作者的进阶方案则于本周在沙特、摩洛哥、泰国及孟加拉国等地率先落地。随着测试深入，Meta 目标是将这些分散的增值功能最终统一整合于 Meta One 之内，形成一套功能完备、迭代迅速的会员订阅生态。

via AI新闻资讯 (author: AI Base)

微软与优重新评估 AI 成本，Token 量飙升难见成

科技媒体 Tom's 近日报道称，包括和优步内的多科技巨头重新审视人工智能（AI 使用成本。AI 技术的速发展，这公司发现 Token 词元）的耗量正在剧上升，但增长并没有带来预期的功能提升。

高盛发布的一项报告显示，预计到 2030 年，随着智能体 AI 应用的扩展，Token 的消费将增长 24 倍，达到每月 12 万万亿 Token（120 quadrillion）。这种大规模的 Token 消耗使得 AI 系统的需求不断增加，甚至可能超过单一 AI 聊天机器人的 1000 倍优步的技术总监普拉文・尼帕利纳加（aveen Nealli Naga）表示，该公司在短短几个月内就耗了 2026AI 预算，却未能用户提供真正有用的功能。在后的采访中优步运营负责人安德鲁麦克唐（Andrew Macdonald 也指出，虽然团队交付更多的代码与这些代码成比例的消费者体验提升却难以实现。

目前，优步内部超过 80% 的软件工程师已在使用智能体 AI，且超过 60% 的代码由 AI 生成。然而，面对如此巨大的投入，管理层仍对这项开支的合理性表示质疑，尤其是在预算消耗远超预期的情况下。

微软方面也开始采取措施削减相关成本。去年 12，微软曾向员工开放 Claude Code 的订阅权限，但在本初却开始收回这一权限计划统一切换至内部的 Copilot CLI。同时，微软将 Hub 上的 Copilot 改为基 Token 的计费方式，这一动正值财结束之际发外界其成本控制策略的关注。

重点：

微软与优步等科技巨重新评估成本，发现消耗增长未能带来有效功能提升。

💸 高盛预计到 2030 年 Token 消费将增长 24 倍，月消耗达到 120 万亿 Token。

🤖 优步内部智能体 AI 的工程师超过 80 但管理层对投入的有效表示质疑。

via AI新闻资讯 (author: AI Base)

软银携手微软：打造 AI 全自动呼叫中心，破解日本劳动力困局

面对日本呼叫中心行业长期面临的劳动力短缺与运营成本高企的双重挑战，软银（SoftBank Corp.）正联合微软，通过构建基于 Microsoft Azure AI（包括 Azure OpenAI 服务及 AI Foundry 模型栈）的下一代智能客服平台，推动客户服务领域的数字化与智能化转型。

一、战略驱动：从“辅助”到“自动”

软银的转型目标是打造一个具备人类服务水准、零等待时间且能 24/7 全天候运行的客服系统，其技术路径清晰地分为两个阶段：

● 第一阶段（人机协作）： 目前软银已部署了 AI 与人工客服的协作模式。AI 充当“副驾驶”，实时优化工作流、处理重复性查询并辅助人工代表，显著缩短了客户的首次响应时间。
● 第二阶段（全自动化）： 软银正逐步迈向“全自动呼叫中心”，利用 AI 智能体（Agentic AI）直接处理复杂的端到端业务流程，旨在实现真正的规模化自动化，解决日本服务经济在劳动力约束下的经营瓶颈。

二、技术核心：Azure AI 全栈集成

软银选择与微软深度共建，关键在于利用微软在大模型与企业级基础设施上的全栈优势：

● 核心架构： 基于 Azure OpenAI 服务、Azure App Service 和 Azure SQL Database 构建可扩展的 AI 流水线。
● 智能中枢： 利用 Azure AI Foundry 模型栈，确保系统能够处理高并发的语音与文本交互，同时保持企业级的安全性与合规性。
● 业务嵌入： 该系统不局限于对话，而是通过深度集成 CRM 与内部业务数据，实现对客户需求的精准理解与快速决策。

三、行业启示：构建可复制的“服务现代化”样本

软银的实践已成为全球电信与服务行业的一项重要参考：

1. 行业标准化： 软银计划将这一整套 AI 客服解决方案商业化，作为标准产品推向整个行业，帮助其他面临相似劳动力困境的企业实现服务转型。
2. AI 智能体的协同： 此项合作印证了 2026 年行业核心趋势——AI 的角色正在从“被动检索工具”向“能够自主规划并执行复杂任务的智能体”跨越。
3. 应对经营压力： 在日本高度竞争的电信市场中，这种通过技术重构服务架构的尝试，已成为维持业务连续性与利润率的必要手段。

目前，这套解决方案不仅在提升软银自身的服务效率，更通过标准化产品形式，为全球追求运营自动化的企业提供了一个具备“规模化落地”可行性的参考模版。随着后续技术的迭代，预计将有更多企业利用类似架构，将呼叫中心从传统的“成本中心”转型为具备高生产力的“智能交互枢纽”。

via AI新闻资讯 (author: AI Base)

英伟达推出开源 AI 框架 Polar，Codex 性能提升近 600%

英伟达研究团队近日发布了一个全新的开源 AI 框架 ——Polar。该框架旨在帮助现有的智能体框架（如 Codex、Claude Code、Qwen Code）接入一种名为广义相对策略优化（GRPO）的训练方法，而不影响其原有的工具调用、上下文组织和补丁提交方式。这一创新将大大提升代码智能体的表现。

GRPO 是一种针对强化学习的优化技术，它通过奖励信号来调整模型策略，帮助模型在多步决策任务中学习到更优的行为。在这项研究中，GRPO 主要用于代码智能体的训练，旨在让模型在实际的工具调用和补丁提交流程中不断改进表现。

研究表明，智能体的强化学习正在逐步从单步任务转向更复杂的长流程任务，例如代码仓库的、浏览器操作以及操作系统的交互。这类任务往往依赖于现有的执行框架，涉及多轮调用、工具使用以及上下文管理等，因此直接将这些框架改写为传统的强化学习环境接口非常困难，可能导致关键训练信号的丢失。

英伟达的 Polar 框架并不试图重写智能体框架，而是通过在模型 API 的边界处放置智能体，保持原有运行逻辑不变。Polar 在执行框架与推理服务器之间了模型智能体，兼容多种请求风格，能够记录关键数据并将其转化为可用于训练的信息。

从系统架构来看，Polar 包括了任务提交、会话调度和状态持久化等功能，通过优化初始化、运行和后处理的流程，显著提升了训练效率。根据实验结果，使用 Polar 与 GRPO 训练的智能体在 SWE-Bench Verified 测试中的性能大幅提升，Codex 的 pass@1 分数从 3.8% 提升至 26.4%，增长幅度达 594.74%。

此外，该框架在提高效率方面也表现出色，训练时间减少了约 5.39 倍，GPU 的平均利用率也显著提升，为未来的智能体训练提供了更强大的支持。

划重点：

🛠️ 英伟达发布了开源 AI 框架 Polar，助力 Codex 等智能体框架接入新训练方法。

📈 Codex 的性能在最新测试中大幅提升，pass@1 分数增长 594.74%。

⚙️ Polar 优化训练效率，显著减少了训练时间与资源消耗。

via AI新闻资讯 (author: AI Base)

恶意开发者利用Claude编写恶意包:超670个受污染npm包威胁开源生态安全

近日，网络安全领域曝出一起利用大语言模型（LLM）协助开发恶意软件的典型案例。据安全研究员Sibi Moosa监测，一名网名为“mousie-5212-super-formatter”的恶意开发者被指利用Anthropic旗下的AI模型Claude协助编写恶意代码，并大规模污染npm包管理器生态。该攻击者在短时间内向npm仓库推送了超过670个包含恶意脚本的软件包，其自动化程度与生成速度引发行业高度警惕。

此次攻击的核心在于利用AI显著降低了恶意代码的编写门槛。这些受污染的npm包被设计用于窃取开发者的敏感凭据（如npm令牌、GitHub令牌）以及内部私有GitHub存储库的源代码。攻击者通过利用Claude生成逻辑严密的窃取脚本，并将获取的数据上传至其控制的存储库中。这一事件揭示了生成式AI在提升开发效能的同时，也正在成为攻击者提升攻击效能与自动化水平的“倍增器”。

专家指出，此番利用AI模型进行自动化包污染与代码窃取，标志着供应链攻击已进入智能化新阶段。传统的基于签名的防御机制难以应对此类由AI生成的高度变异且具有迷惑性的恶意载体。随着AI编程辅助工具的普及，如何防止模型被滥用于漏洞挖掘与恶意开发，已成为AI安全治理亟待解决的课题。

via AI新闻资讯 (author: AI Base)

8 小时前

Snowflake与AWS签订60亿美元采购协议

云数据仓库公司Snowflake公布强劲季度业绩，并宣布未来五年将在亚马逊云服务AWS上投入六十亿美元，消息推动其盘后股价暴涨。周三，亚马逊宣布，Snowflake已承诺在五年内向 AWS采购价值60亿美元的服务与技术，内容涵盖亚马逊自研的基于Arm架构的Graviton通用芯片，以及用于人工智能的GPU。这是继 Anthropic 公司承诺十年内在AWS投入逾1000亿美元之后，AWS在AI领域赢得的又一重大客户承诺，显示出其在云基础设施竞争中的持续吸引力。与此同时，Snowflake还宣布以未披露金额收购AI初创公司Natoma，进一步强化其AI布局。

—— 华尔街见闻、华尔街日报

via 风向旗参考快讯 - Telegram Channel

OpenAI 确认 ChatGPT 及 API 高延迟问题已解决

针对5月27日出现的 ChatGPT 及 API 服务响应缓慢问题，OpenAI 官方已在昨日深夜至今日凌晨完成修复工作，相关服务现已恢复正常。

一、事件回顾

● 问题确认: 北京时间5月27日22时47分，OpenAI 官方状态页面确认其 ChatGPT 及 API 服务出现“高延迟”故障。据多地用户反馈，该问题在当日凌晨即已开始，表现为用户提问后等待回复的时间显著延长。
● 修复进度: 经过团队排查与紧急修复，OpenAI 于北京时间5月28日凌晨4时06分正式确认故障已解决，服务恢复正常访问。

二、剩余观察项

尽管核心高延迟问题已解决，但 OpenAI 状态页面显示目前仍有部分辅助功能处于优化与观察阶段:

● Codex 功能: 上下文压缩速度仍较预期偏慢。
● 企业版功能: 安卓版 ChatGPT 企业版在切换工作区时仍存在部分异常情况。

OpenAI 目前正持续跟进这些细节问题的修复，建议用户在使用过程中如遇相关界面操作障碍，可关注官网状态页面的最新更新。

via AI新闻资讯 (author: AI Base)

体验完阿里首款Design Agent，我开始替UI/前端焦虑了..

via 掘金人工智能本月最热 (author: AI袋鼠帝)

体验完阿里首款Design Agent，我开始替UI/前端焦虑了..

大家好，我是袋鼠帝。作为一名后端程序员，我略懂前端，但是对于UI设计是一窍不通。还记得以前上班的时候，公司大部分UI设计都是妹子，我连Figma都没打开过。自从AI快速发展起来以后，我虽然能做出各种功能复杂的前端的项目，但一直以来有个问题困扰我：做不好看。我能分辨什么样的页面是高级的、漂亮的，但我就是很难做出那种高级感、带交互动效的页面。这种感觉很难受😮‍💨本来我还想去学一下UI设计和Figma的，但一直没时间。然后...我就又一次体会到了什么叫只要你学的慢，就可以不用学。不得不说，这句话还是有一定的道…

OpenAI正加速推进其广告业务商业化进程。最新信息显示，该公司已开始向更多潜在广告主发送广告平台邀请，允许他们在特定地区的免费ChatGPT用户中进行针对性投放。这一举措标志着OpenAI从早期有限测试转向更广泛的自助服务模式，进一步探索如何在保持用户体验的同时实现可持续变现。投放范围与核心参数根据最新邀请信息，广告主目前可针对美国、加拿大、澳大利亚和新西兰的免费ChatGPT用户投放广告。这些地区是OpenAI广告测试的重点市场，用户在与ChatGPT互动、探索选项、比较选择和做出决策时，将看到自然融入的广告。 …