ChatGPT / AI新闻聚合

SpaceX、OpenAI与Anthropic拟上市人工智能热潮或将迎来极限考验

埃隆·马斯克、山姆·奥特曼与达里奥·阿莫代伊曾就OpenAI如何赶超谷歌的人工智能业务产生激烈争执。如今，这三位行业领军者正筹备规模空前的上市计划。这批上市主体有望成长为市值达万亿美元级别的企业，盘活持续低迷的美国新股市场，同时也将检验公众投资者能否承接这一波接踵而至的科技企业上市潮。 2018年马斯克、2020年阿莫代伊先后与OpenAI闹得不欢而散并离职，双方的竞争态势进一步加剧。眼下，这场角逐也演变为一场资本比拼——三家企业谁能汇聚最雄厚的资金。阿莫代伊执掌的Anthropic、马斯克旗下的Sp…

9 小时前

优步总裁：AI支出正变得“更难证明合理性”

在2026年仅过了四个月就用完其年度人工智能预算后，网约车巨头优步现在正在质疑其投资是否真正带来了有意义的回报。优步总裁兼首席运营官麦克唐纳在接受采访时表示，该公司没有看到Claude Code的Token消耗量上升与向消费者提供的更有用功能之间存在联系。麦克唐纳说：“这种联系还不存在，对吧？我认为也许隐含地有更多东西在交付，但很难将这些统计数据与“我们现在实际增加了 25% 的实用消费者功能”直接联系起来。在未来的几个季度和几年里，这可能会变得更清晰，但我觉得今天这很难，即使某些底层指标正朝着非常惊人的方向发展。”

—— Theverge

via 风向旗参考快讯 - Telegram Channel

奥尔特曼：AI对白领就业影响小于早先判断

OpenAI CEO说，AI的快速发展和普及不太可能引发全球性的 “就业末日”。奥尔特曼周二出席澳洲联邦银行举办的会议时坦言，自OpenAI在2022年推出ChatGPT以来，公司对AI技术走向的预测大致正确，但在社会和经济影响方面的判断则相当错误。“我很高兴自己在这件事上判断错了。我原本以为，到现在为止，会有更多入门级白领岗位被淘汰，但实际情况并非如此。”他如今对为何没有出现预期中的情况有了更多理解，也庆幸当初的担忧尚未成为现实。“有人会说，你本可以少制造一些恐慌和悲观情绪。但当时我认为这是一个真实存在的风险，我们应该公开讨论，而这种风险未来仍有可能出现。”

—— 新加坡联合早报

via 风向旗参考快讯 - Telegram Channel

中国将旅行限制扩大至私企顶尖AI人才

中国政府正在限制私营公司顶尖人工智能专业人员的海外旅行，例如阿里巴巴集团以及DeepSeek，表明旨在保护其技术并在一个关键领域追赶美国的措施升级。知情人士表示，政府机构已开始对从事先进人工智能工作且被认为对国家具有战略重要性的个人施加限制。知情人士说，这意味着他们在开始海外旅行前需要获得相关当局的批准。北京多年来一直对关键人员施加旅行限制，从著名高校研究人员到核科学家及国企高管。中国政府现在正特别瞄准人工智能领域内的人才。知情人士表示，在被告知将受到此类限制的关键行业专业人士中，有初创公司创始人、研究人员和高管等各类人员。

—— 彭博社

via 风向旗参考快讯 - Telegram Channel

人类对局体验再升级！免费开源 AI 国际象棋引擎 Maia 3 正式发布

Maia Chess 团队近日正式推出了全新的开源国际象棋引擎——“Maia 3”。该模型在 2.5 亿局真实人类对局数据的训练下，Elo 评分成功达到约 1800 分，较上一代实现了近 300 分的跨越式提升。更重要的是，该引擎完全免费开源并支持本地部署，标志着 AI 棋类引擎向“平民化”迈出了关键一步。

独辟蹊径：专注于模拟人类决策模式

与 AlphaZero、Stockfish 等追求超人类水平、动辄 3500+ Elo 评分的传统顶级引擎不同，Maia 项目的核心初衷是探索 AI 如何更好地理解和模拟人类的下棋行为。它专注于“像人类一样下棋”——预测人类的实际走法，而非寻找绝对的数学最优解。

这种“人类中心”的训练方式，让 Maia 3 在对局中不会走出人类难以理解的“神之一手”，而是能够精准模拟真实对局中的常见模式、心理偏好甚至逻辑错误。这使其能够摆脱超强引擎带给玩家的挫败感，成为更具教育意义和陪伴价值的业余俱乐部级高手陪练。

Llama 架构加持与多棋种生态扩展

在技术架构上，Maia 3 迎来了重大升级。它基于 Meta 的 Llama 3.1 架构构建，采用了 decoder-only transformer 设计，相比前代基于 GPT-2 的架构，提供了更强的上下文理解能力和计算效率。其训练数据涵盖了从初学者到大师级别的各个水平段。

值得瞩目的是，Maia 3 已经不再局限于国际象棋，而是进一步扩展支持了多种棋类游戏，包括将棋（Shogi）、围棋（Go）以及中国象棋（Xiangqi）。这一多模态能力的进化，使其一跃成为通用的棋类 AI 学术研究平台。

消费级硬件流畅运行推动 AI 民主化

Maia 3 采用了极为友好的 Apache 2.0 许可证开源，这意味着全球开发者可以自由地对其进行使用、修改、分发甚至商业化扩展。目前，该项目的代码、训练数据和模型权重均已无保留地发布至 GitHub。

为了彻底降低使用门槛，团队对 Maia 3 进行了深度的硬件运行优化。官方表示，用户无需配备高端显卡，只需一台带有现代 CPU 的普通笔记本电脑即可流畅运行本地部署。目前，玩家已可直接在lichess.org平台上在线与 Maia 3 展开对局，该引擎也将为未来的在线对局平台和教学软件提供高质量的免费底层支持。

via AI新闻资讯 (author: AI Base)

事实性幻觉率降至3.3%！百川智能将发布新一代医疗大模型Baichuan-M4

在清华大学百川楼举办的“AI医疗新范式”学术论坛上，百川智能创始人兼CEO王小川正式展示了即将发布的新一代医疗大模型——“Baichuan-M4”以及AI家庭医生“百小医”。该模型的亮相，标志着AI技术在医疗垂直领域的精准度与应用形态取得了突破性进展。

登顶三大权威榜单，攻克医疗幻觉痛点

在医疗AI领域，大模型的“胡言乱语”（事实性幻觉）一直是阻碍其进入临床的核心痛点。为此，百川智能开发了原创的“事实性感知强化学习算法”，成功将Baichuan-M4 裸模型的事实性幻觉率压低至3.3%。

凭借这一技术突破，Baichuan-M4 在HealthBench、HealthBench Hard、HealthBench Professional三大权威医疗榜单中同时位列世界第一，其综合医疗能力已超越GPT-5.5、Opus 4. 7 以及DeepSeek-V4-Pro等主流旗舰大模型。目前，百川智能已联合北京儿童医院、中国医学科学院肿瘤医院和上海交通大学医学院附属瑞金医院等三家国内顶尖医院展开相关临床研究。

基于微信生态构建智能家庭医生

针对中国优质医疗资源供给不足的核心矛盾，王小川强调，大模型不仅要解决“大脑能力”，更要通过合适的产品形态实现“身体触达”。基于这一理念打造的AI家庭医生“百小医”，核心定位为“明明白白看医生，安安心心管家人”。

在实际应用中，“百小医”将深度融入微信生态，用户只需主动添加企业微信“百小医@百川家医”并将其拉入家庭群，系统便会自动为每位家庭成员建立独立的健康档案。它能够在日常对话中捕捉并结构化记录成员的身体状态、用药历史和检查数据，敏锐识别闲聊中的高危健康信号，并主动提供复诊和用药提醒。

via AI新闻资讯 (author: AI Base)

百川智能发布 Baichuan-M4 大模型与“百小医”，AI 医疗从“咨询”转向“全科管家”

via AI新闻资讯 (author: AI Base)

百川智能发布 Baichuan-M4 大模型与“百小医”，AI 医疗从“咨询”转向“全科管家”

在近日于清华大学百川楼举办的“AI 医疗新范式”学术论坛上，百川智能创始人兼 CEO 王小川正式发布了新一代医疗专用大模型 Baichuan-M4 以及 AI 家庭医生产品 “百小医”。此次发布标志着百川智能在医疗赛道的深度落地，旨在破解当前 AI 医疗“咨询有余、触达不足”的行业痛点。

三星电子即将允许员工使用外部AI模型

三星电子周二发布的内部备忘录显示，该公司将从下个月开始允许员工使用其他公司开发的生成式AI模型，例如ChatGPT。备忘录称，三星计划于六月正式推出一项外部生成式AI服务，目标用户是其设备体验 (DX）部门的员工，该部门涵盖公司的显示器、移动设备和家电业务。业内人士透露，三星还计划在下半年开设AI应用方面的培训课程。此前，出于安全考虑，三星员工仅被允许使用其内部人工智能模型 Samsung Gauss。据公司高管透露，员工必须接受安全培训才能获得外部人工智能模型的访问权限。他们还补充说，外部人工智能模型的使用仍将仅限于公司半导体或器件解决方案(DS)部门。

—— 新浪财经

via 风向旗参考快讯 - Telegram Channel

OpenAI首席执行官：AI普及并不会引发“就业末日”

OpenAI首席执行官山姆・奥尔特曼周二表示，人工智能的快速发展与普及并不会引发全球性的“就业末日”，目前该技术挤占的白领岗位数量，也低于他此前的担忧。奥尔特曼在悉尼出席澳大利亚联邦银行（CBA）会议时称，他最初十分担心人工智能会对全球就业市场造成冲击。

他表示，2022年推出ChatGPT时，OpenAI团队对技术发展趋势的预判“大体准确”，但对其社会与经济影响的判断却“出现了明显偏差”。

在与澳大利亚联邦银行首席执行官马特・科明的对话中，奥尔特曼说道：“预判失准反倒让我松了一口气。我原本以为，如今入门级白领岗位会因人工智能大幅缩减，但实际情况并非如此。”

“现在我更清楚背后的原因，对此我也心怀庆幸。在这件事上，我的直觉确实出现了偏差。”

“有人会说，你本可以让大家不必陷入恐慌与悲观情绪。但在当时，我认为这是切实存在的风险，理应公开探讨，而且风险未来依然有可能显现。”

奥尔特曼当日并未给出具体就业数据，但他此前曾提及，人工智能发展或引发全行业裁员。

目前，包括汇丰银行、亚马逊、渣打银行以及澳大利亚联邦银行在内，越来越多的国际企业都宣布，部分岗位已由人工智能接手。

知情人士消息称，OpenAI计划在未来数周内向美国监管机构秘密提交首次公开募股申请。该机构去年10月曾报道，OpenAI目标估值达1万亿美元，拟募资至少600亿美元。

工作中的“人文属性”无可替代

奥尔特曼表示，他逐渐意识到，即便人工智能在各行各业承担的工作越来越多，职场中依托人的特质完成的部分依旧无法被取代。

他透露，自己曾借助人工智能回复即时通讯软件与邮件消息，如今又选择亲自处理部分往来信息。

“我此前让AI代为回复消息，并标注‘本条消息由萨姆的人工智能代发’。这件事让我真切体会到，人与人之间的联结至关重要。”

“这类沟通占据了我大量时间，短期内我绝不会将其完全交由人工智能处理。”

他称，这番感悟让他确信，诸多岗位所必需的人际互动，无法被人工智能替代。

“这件事从正反两方面改变了我的看法，就业市场的最终走向，很可能和我们此前设想的截然不同。”

“我认为，业内部分人士所担忧的就业末日并不会真正到来。”

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球市场播报)

三星电子将从下月开始允许员工使用外部AI模型

三星电子周二发布的一份内部备忘录显示，该公司将从下个月开始允许员工使用其他公司开发的生成式人工智能（AI）模型，例如ChatGPT。

备忘录称，三星计划于6月正式推出一项外部生成式AI服务，目标用户是其设备体验（DX）部门的员工，该部门涵盖公司的显示器、移动设备和家电业务。

据业内人士透露，三星还计划在下半年开设人工智能应用方面的培训课程，预计将有来自三星电子及其主要附属公司的约 2000 名高管参加。

此前，出于安全考虑，三星员工仅被允许使用其内部人工智能模型Samsung Gauss。

据公司高管透露，员工必须接受安全培训才能获得外部人工智能模型的访问权限。他们还补充说，外部人工智能模型的使用仍将仅限于公司半导体或器件解决方案（DS）部门。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球市场播报)

OpenAI高薪招募安全专家应对AI自我进化风险

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球市场播报)

OpenAI的目标是开发一种能够自我优化的AI工具。如今，这家公司正在为随之而来的风险做准备。在过去六个月里，OpenAI和Anthropic的编程工具取得了巨大进步之后，AI系统所谓“递归式自我改进”的潜力，已经成为AI行业负责人关注的重点。 Demis Hassabis本周表示，人类如今正站在“奇点”的脚下——也就是AI开始自我发展，并超越人类智能的那个时刻。计划于今年上市的OpenAI，最近发布了一个不同寻常的招聘岗位：公司正在寻找一名安全研究员，专门研究“当AI能够训练出更优秀版本的自己时”所带来的后果。…

OpenAI高薪招募安全专家应对AI自我进化风险

阿里 Qwen3.7-Max 编程能力全球登顶第二！Code Arena 1541 分，仅次 Claude，35 小时自主任务刷新生产力上限

via AI新闻资讯 (author: AI Base)

阿里 Qwen3.7-Max 编程能力全球登顶第二！Code Arena 1541 分，仅次 Claude，35 小时自…

AIbase 报道5月26日，全球权威编程榜单 Code Arena 最新放榜，阿里巴巴 Qwen3.7-Max 以1541分强势登上全球第二，仅次于 Claude 系列模型，成为国产大模型在编程领域的新标杆。这一成绩超越了包括 GPT-5.5、Gemini3.5Flash 等多款前沿模型，标志着中国 AI 在 Agentic Coding 和长时程任务上的重大突破。

14 小时前

支付宝披露：3亿笔AI付、支持95%通用智能体、发布AI钱包和Token Pay

via AI新闻资讯 (author: AI Base)

支付宝披露：3亿笔AI付、支持95%通用智能体、发布AI钱包和Token Pay

5月26日，支付宝宣布，“AI支付”已完成3亿笔AI智能体支付、支持95%通用智能体框架，成为全球首个大规模商用的AI原生支付基建。同时，支付宝发布全球首个Token Pay服务和AI钱包产品，连同此前推出的AI付与AI收，构建了面向AI时代的全栈AI原生支付体系，涵盖了从授权到管理、从支付到结算、从安全到信任的完整服务。这也是继快捷支付、扫码支付分别助力电商时代、移动互联网时代之后，支付宝再次以创新的AI支付助力AI时代。蚂蚁集团首席执行官韩歆毅表示:“AI时代下商业本质未变，但智能体新角色重构一…

14 小时前

隐藏的恶意“周报”！微软 Copilot 曝间接提示词注入漏洞风险

安全研究机构 PromptArmor 近日发布报告披露，微软 Microsoft 365 旗下的 AI 智能体服务 Copilot Cowork 存在严重的安全漏洞。攻击者可利用一种名为“间接提示词注入”的技术，在无需用户批准的情况下，秘密窃取并外泄组织内部的企业云盘机密文件。

潜伏于办公模板中的恶意指令

作为深度集成的 AI 助手，Cowork 本身拥有代替用户发送邮件、发布 Teams 消息以及检索 OneDrive 和 SharePoint 组织内部信息的极高权限。然而研究人员发现，攻击者只需将恶意指令隐藏在网页、文档或看似普通的办公自动化模板（如“每周工作回顾”）中，即可诱骗智能体上钩。

一旦用户调用 Cowork 处理了这个包含恶意提示词的文件，智能体便会受到操纵，谎称需要生成文档预览。随后，它会自动抓取相关高敏感文件的预认证下载链接，并将这些链接通过 Teams 消息隐蔽地发回给攻击者，整个外传过程在后台悄然进行，用户极难察觉。

定时任务放大风险且防范治理困难

报告指出，由于 Copilot Cowork 具备定时自动执行任务的功能，这让安全风险被成倍放大。例如，像“周报汇总”这类被设定为周期性运行的自动化任务，即使在用户离开屏幕、无人值守的情况下，也会在后台反复触发并执行攻击链。

在安全测试中，该攻击方法实现了 5 次测试全部完整跑通的惊人成功率。更糟糕的是，管理员对这类“技能文件”的可见性和治理难度极高，且该漏洞不仅在自动模式下有效，在明确指定调用 Claude Opus 4.7 等更强大的大模型时同样无法幸免。

via AI新闻资讯 (author: AI Base)

全球AI监管转折点：从“承诺制”迈向“发布前强制测试”

随着人工智能大模型能力的指数级跃升，全球监管逻辑正在发生根本性重构：从过去仅停留在原则与自愿承诺的“软约束”，转向由政府主导、前置化、基于实证的“硬测试”。这一转变，标志着 AI 监管已进入“硬核”实操时代。

一、新常态：谁来给 AI 模型做“体检”？

以往，大模型厂商往往通过内部“红队测试”或发布安全报告的方式进行自我评估。然而，这种“考生给自己判分”的模式已无法满足国家安全层面的监管需求。

当前，英国 AI 安全研究院（AISI，现已更名为 AI Security Institute）与美国商务部下属的 AI 标准与创新中心（CAISI，原美国 AI 安全研究院）正在引领这一范式变革。模型发布前进行国家安全评估，正成为行业公认的“入场券”。

● 具体测什么？ 评估重心已从宽泛的“原则管理”落实到具体的技术红线：模型是否会被用于大规模网络攻击？是否会降低制造危险生物/化学物质的门槛？在关键基础设施应用中能否绕过安全保护层？
● 谁在接受测试？ 截至目前，Google DeepMind、Microsoft、xAI、Anthropic 以及 OpenAI 等全球 AI 领军企业，均已与美英监管机构达成协议，在模型公开发布前配合开展安全评估。

二、联动协作：构建全球 AI 监管“防御网”

监管的力量不仅在于单一国家，更体现在国际间的信息互认与资源协同。

● 英澳协作： 5 月 25 日，英国与澳大利亚正式签署谅解备忘录（MoU），深化两国 AI 安全研究院（AISI）在安全评估与前沿风险研究领域的合作。双方将共享 AI 能力洞察，并共同推动国际最佳测试实践，以应对全球网络安全威胁的快速迭代。
● 跨境实战： 此类合作框架意味着，跨国 AI 企业在面临不同市场的监管合规时，将面对一套日益统一的“发布前安全评估”流程。这种趋势正将安全测试能力从单一的研发成本，重塑为企业参与全球竞争的核心资质。

三、行业新规则：安全能力即商业竞争力

对于 AI 创业公司及大模型厂商而言，监管环境的变化带来了深远的战略影响：

1. 产品开发的前置约束： 评估流程将嵌入模型开发生命周期。模型能力越强，企业所需提供的访问权限与技术材料越详尽。
2. 安全技术的溢价： 随着政府采购、企业采购及国际合规准入门槛的提高，具备完善安全防护与通过政府测试能力的 AI 产品，将在市场上获得显著的竞争优势。
3. 从“原则声明”到“实测过关”： 监管机构的关注点不再是公司有没有写过“AI 安全承诺书”，而是有没有通过专业的测试机构进行真实场景下的压力测试。

四、结语：迈向更加务实的监管时代

AI 治理的本质，是创新活力与风险管控之间的动态平衡。美英等国推行的“强制性安全评估”模式，虽然增加了模型上线的流程复杂性与技术成本，但它为人工智能的长久发展构建了必要的稳定器。

这种基于现实问题、实证驱动的监管范式，无疑比原则声明更麻烦、更具挑战，但它也更接近现实，为构建一个安全、可控、值得信赖的智能社会奠定了基石。对于身处 AI 浪潮中的企业而言，拥抱这一监管趋势，将不再是负担，而是通往未来市场的必备通行证。

via AI新闻资讯 (author: AI Base)

国产模型大突破！昆仑万维发布天工高性能 Agent 模型 SkyClaw-v1.0

昆仑万维集团今日正式推出了面向真实工作流的高性能 Agent 模型——SkyClaw-v1.0，并同步发布了兼顾性能与性价比的轻量化版本 SkyClaw-v1.0-lite。该模型的上线，标志着国产大模型在智能体生态建设与长文本处理领域迈出了坚实的一步。

支持百万上下文与多步任务执行

SkyClaw-v1.0 具备支持百万 token 的超长上下文能力，并针对复杂工具调用、多轮任务执行、代码生成以及交互式应用构建等真实智能体场景进行了深度优化。模型目前已原生接入天工 Skywork 平台，可在 OpenClaw、Hermes、Nanobot 等主流 Agent 环境中流畅运行。

在主流 Agent 评测中，SkyClaw-v1.0 展现出了极为稳定的多步任务执行能力。其综合性能不仅全面超越了 Minimax 2.7、DeepSeek V4 Flash 等主流开源模型，在特定任务上的表现更是直逼 DeepSeek V4 Pro、Claude Opus 4.6 等更大规模的顶级旗舰。

极具性价比并开启限时免费试用

除了技术性能的突破，SkyClaw-v1.0 在商业化普及上也带来了巨大的诚意。该模型的市场定价极具竞争力，直接低于 Minimax 2.7 与 Qwen 3.6 系列模型的一半，为高性能 Agent 能力的规模化调用奠定了坚实的成本基础。

为了让开发者与企业用户抢先体验其卓越的性能，昆仑万维宣布即日起正式开放为期 2 至 4 周的免费试用。用户只需登录官网打开天工 Skywork，即可免配置直接在真实任务中体验其长上下文理解、工具调用和研究型数据分析等全套核心能力。

via AI新闻资讯 (author: AI Base)

攻克悬置 56 年难题！谷歌AlphaProof Nexus颠覆数学界

谷歌DeepMind团队近日正式推出了全新的AI框架“AlphaProof Nexus”。该系统凭借强大的人工智能推理与形式化验证能力，在数学研究领域取得了里程碑式的突破，成功解开了两道已悬而未决长达 56 年的Erdős（埃尔德什）数学难题。

独创四级智能体架构协同破局

AlphaProof Nexus在架构设计上极具创新，由 4 个复杂度递增的AI智能体组合而成。系统从最基础的Gemini模型与Lean编译器循环交互开始，逐步引入代码补全片段机制和类似AlphaEvolve的进化机制，最终通过功能最完整的智能体实现多个证明草稿的共享、评分与排序。

在针对 353 个开放的Erdős问题进行的自主测试中，该系统不仅成功解决了 9 个问题，还顺带证明了整数序列在线百科全书中的 44 个开放猜想。令人惊叹的是，AlphaProof Nexus完成单个复杂问题的推理成本仅仅需要数百美元。

编译器反馈锚定推动AI进化

除了在组合数学、数论等领域斩获颇丰，该系统还成功解决了一个存在 15 年的Hilbert函数问题，并显著改进了凸优化中的已知界限。研究团队在分析实验数据时发现，即使是最简单的基础智能体，在强大的Lean编译器反馈“锚定”作用下，也能成功攻克部分难题。

这一发现表明，底层模型能力的持续提升与严格的代码形式化验证相结合，正在为AI注入逻辑严密的数学直觉。谷歌此次的技术飞跃，不仅标志着AI驱动的科学发现迈向新高度，也预示着人类正迎来与AI深度协作攻克科学禁区的新时代。

via AI新闻资讯 (author: AI Base)

微软 Webwright 开源：网页智能体从“点击式”进化为“代码式”

via AI新闻资讯 (author: AI Base)