https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
优步总裁:AI支出正变得“更难证明合理性”

在2026年仅过了四个月就用完其年度人工智能预算后,网约车巨头优步现在正在质疑其投资是否真正带来了有意义的回报。优步总裁兼首席运营官麦克唐纳在接受采访时表示,该公司没有看到Claude Code的Token消耗量上升与向消费者提供的更有用功能之间存在联系。麦克唐纳说:“这种联系还不存在,对吧?我认为也许隐含地有更多东西在交付,但很难将这些统计数据与“我们现在实际增加了 25% 的实用消费者功能”直接联系起来。在未来的几个季度和几年里,这可能会变得更清晰,但我觉得今天这很难,即使某些底层指标正朝着非常惊人的方向发展。”

—— Theverge

via 风向旗参考快讯 - Telegram Channel
奥尔特曼:AI对白领就业影响小于早先判断

OpenAI CEO说,AI的快速发展和普及不太可能引发全球性的 “就业末日”。奥尔特曼周二出席澳洲联邦银行举办的会议时坦言,自OpenAI在2022年推出ChatGPT以来,公司对AI技术走向的预测大致正确,但在社会和经济影响方面的判断则相当错误。“我很高兴自己在这件事上判断错了。我原本以为,到现在为止,会有更多入门级白领岗位被淘汰,但实际情况并非如此。”他如今对为何没有出现预期中的情况有了更多理解,也庆幸当初的担忧尚未成为现实。“有人会说,你本可以少制造一些恐慌和悲观情绪。但当时我认为这是一个真实存在的风险,我们应该公开讨论,而这种风险未来仍有可能出现。”

—— 新加坡联合早报

via 风向旗参考快讯 - Telegram Channel
中国将旅行限制扩大至私企顶尖AI人才

中国政府正在限制私营公司顶尖人工智能专业人员的海外旅行,例如阿里巴巴集团以及DeepSeek,表明旨在保护其技术并在一个关键领域追赶美国的措施升级。知情人士表示,政府机构已开始对从事先进人工智能工作且被认为对国家具有战略重要性的个人施加限制。知情人士说,这意味着他们在开始海外旅行前需要获得相关当局的批准。北京多年来一直对关键人员施加旅行限制,从著名高校研究人员到核科学家及国企高管。中国政府现在正特别瞄准人工智能领域内的人才。知情人士表示,在被告知将受到此类限制的关键行业专业人士中,有初创公司创始人、研究人员和高管等各类人员。

—— 彭博社

via 风向旗参考快讯 - Telegram Channel
人类对局体验再升级!免费开源 AI 国际象棋引擎 Maia 3 正式发布

Maia Chess 团队近日正式推出了全新的开源国际象棋引擎——“Maia 3”。该模型在 2.5 亿局真实人类对局数据的训练下,Elo 评分成功达到约 1800 分,较上一代实现了近 300 分的跨越式提升。更重要的是,该引擎完全免费开源并支持本地部署,标志着 AI 棋类引擎向“平民化”迈出了关键一步。

独辟蹊径:专注于模拟人类决策模式

与 AlphaZero、Stockfish 等追求超人类水平、动辄 3500+ Elo 评分的传统顶级引擎不同,Maia 项目的核心初衷是探索 AI 如何更好地理解和模拟人类的下棋行为。它专注于“像人类一样下棋”——预测人类的实际走法,而非寻找绝对的数学最优解。

这种“人类中心”的训练方式,让 Maia 3 在对局中不会走出人类难以理解的“神之一手”,而是能够精准模拟真实对局中的常见模式、心理偏好甚至逻辑错误。这使其能够摆脱超强引擎带给玩家的挫败感,成为更具教育意义和陪伴价值的业余俱乐部级高手陪练。

Llama 架构加持与多棋种生态扩展

在技术架构上,Maia 3 迎来了重大升级。它基于 Meta 的 Llama 3.1 架构构建,采用了 decoder-only transformer 设计,相比前代基于 GPT-2 的架构,提供了更强的上下文理解能力和计算效率。其训练数据涵盖了从初学者到大师级别的各个水平段。

值得瞩目的是,Maia 3 已经不再局限于国际象棋,而是进一步扩展支持了多种棋类游戏,包括将棋(Shogi)、围棋(Go)以及中国象棋(Xiangqi)。这一多模态能力的进化,使其一跃成为通用的棋类 AI 学术研究平台。

消费级硬件流畅运行推动 AI 民主化

Maia 3 采用了极为友好的 Apache 2.0 许可证开源,这意味着全球开发者可以自由地对其进行使用、修改、分发甚至商业化扩展。目前,该项目的代码、训练数据和模型权重均已无保留地发布至 GitHub。

为了彻底降低使用门槛,团队对 Maia 3 进行了深度的硬件运行优化。官方表示,用户无需配备高端显卡,只需一台带有现代 CPU 的普通笔记本电脑即可流畅运行本地部署。目前,玩家已可直接在lichess.org平台上在线与 Maia 3 展开对局,该引擎也将为未来的在线对局平台和教学软件提供高质量的免费底层支持。

via AI新闻资讯 (author: AI Base)
事实性幻觉率降至3.3%!百川智能将发布新一代医疗大模型Baichuan-M4

在清华大学百川楼举办的“AI医疗新范式”学术论坛上,百川智能创始人兼CEO王小川正式展示了即将发布的新一代医疗大模型——“Baichuan-M4”以及AI家庭医生“百小医”。该模型的亮相,标志着AI技术在医疗垂直领域的精准度与应用形态取得了突破性进展。

登顶三大权威榜单,攻克医疗幻觉痛点

在医疗AI领域,大模型的“胡言乱语”(事实性幻觉)一直是阻碍其进入临床的核心痛点。为此,百川智能开发了原创的“事实性感知强化学习算法”,成功将Baichuan-M4 裸模型的事实性幻觉率压低至3.3%。

凭借这一技术突破,Baichuan-M4 在HealthBench、HealthBench Hard、HealthBench Professional三大权威医疗榜单中同时位列世界第一,其综合医疗能力已超越GPT-5.5、Opus 4. 7 以及DeepSeek-V4-Pro等主流旗舰大模型。目前,百川智能已联合北京儿童医院、中国医学科学院肿瘤医院和上海交通大学医学院附属瑞金医院等三家国内顶尖医院展开相关临床研究。

基于微信生态构建智能家庭医生

针对中国优质医疗资源供给不足的核心矛盾,王小川强调,大模型不仅要解决“大脑能力”,更要通过合适的产品形态实现“身体触达”。基于这一理念打造的AI家庭医生“百小医”,核心定位为“明明白白看医生,安安心心管家人”。

在实际应用中,“百小医”将深度融入微信生态,用户只需主动添加企业微信“百小医@百川家医”并将其拉入家庭群,系统便会自动为每位家庭成员建立独立的健康档案。它能够在日常对话中捕捉并结构化记录成员的身体状态、用药历史和检查数据,敏锐识别闲聊中的高危健康信号,并主动提供复诊和用药提醒。

via AI新闻资讯 (author: AI Base)
三星电子即将允许员工使用外部AI模型

三星电子周二发布的内部备忘录显示,该公司将从下个月开始允许员工使用其他公司开发的生成式AI模型,例如ChatGPT。备忘录称,三星计划于六月正式推出一项外部生成式AI服务,目标用户是其设备体验 (DX)部门的员工,该部门涵盖公司的显示器、移动设备和家电业务。业内人士透露,三星还计划在下半年开设AI应用方面的培训课程。此前,出于安全考虑,三星员工仅被允许使用其内部人工智能模型 Samsung Gauss。据公司高管透露,员工必须接受安全培训才能获得外部人工智能模型的访问权限。他们还补充说,外部人工智能模型的使用仍将仅限于公司半导体或器件解决方案(DS)部门。

—— 新浪财经

via 风向旗参考快讯 - Telegram Channel
OpenAI首席执行官:AI普及并不会引发“就业末日”

OpenAI首席执行官山姆・奥尔特曼周二表示,人工智能的快速发展与普及并不会引发全球性的“就业末日”,目前该技术挤占的白领岗位数量,也低于他此前的担忧。奥尔特曼在悉尼出席澳大利亚联邦银行(CBA)会议时称,他最初十分担心人工智能会对全球就业市场造成冲击。

他表示,2022年推出ChatGPT时,OpenAI团队对技术发展趋势的预判“大体准确”,但对其社会与经济影响的判断却“出现了明显偏差”。

在与澳大利亚联邦银行首席执行官马特・科明的对话中,奥尔特曼说道:“预判失准反倒让我松了一口气。我原本以为,如今入门级白领岗位会因人工智能大幅缩减,但实际情况并非如此。”

“现在我更清楚背后的原因,对此我也心怀庆幸。在这件事上,我的直觉确实出现了偏差。”

“有人会说,你本可以让大家不必陷入恐慌与悲观情绪。但在当时,我认为这是切实存在的风险,理应公开探讨,而且风险未来依然有可能显现。”

奥尔特曼当日并未给出具体就业数据,但他此前曾提及,人工智能发展或引发全行业裁员。

目前,包括汇丰银行、亚马逊、渣打银行以及澳大利亚联邦银行在内,越来越多的国际企业都宣布,部分岗位已由人工智能接手。

知情人士消息称,OpenAI计划在未来数周内向美国监管机构秘密提交首次公开募股申请。该机构去年10月曾报道,OpenAI目标估值达1万亿美元,拟募资至少600亿美元。

工作中的“人文属性”无可替代

奥尔特曼表示,他逐渐意识到,即便人工智能在各行各业承担的工作越来越多,职场中依托人的特质完成的部分依旧无法被取代。

他透露,自己曾借助人工智能回复即时通讯软件与邮件消息,如今又选择亲自处理部分往来信息。

“我此前让AI代为回复消息,并标注‘本条消息由萨姆的人工智能代发’。这件事让我真切体会到,人与人之间的联结至关重要。”

“这类沟通占据了我大量时间,短期内我绝不会将其完全交由人工智能处理。”

他称,这番感悟让他确信,诸多岗位所必需的人际互动,无法被人工智能替代。

“这件事从正反两方面改变了我的看法,就业市场的最终走向,很可能和我们此前设想的截然不同。”

“我认为,业内部分人士所担忧的就业末日并不会真正到来。”

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
三星电子将从下月开始允许员工使用外部AI模型

三星电子周二发布的一份内部备忘录显示,该公司将从下个月开始允许员工使用其他公司开发的生成式人工智能(AI)模型,例如ChatGPT。

备忘录称,三星计划于6月正式推出一项外部生成式AI服务,目标用户是其设备体验(DX)部门的员工,该部门涵盖公司的显示器、移动设备和家电业务。

据业内人士透露,三星还计划在下半年开设人工智能应用方面的培训课程,预计将有来自三星电子及其主要附属公司的约 2000 名高管参加。

此前,出于安全考虑,三星员工仅被允许使用其内部人工智能模型Samsung Gauss。

据公司高管透露,员工必须接受安全培训才能获得外部人工智能模型的访问权限。他们还补充说,外部人工智能模型的使用仍将仅限于公司半导体或器件解决方案(DS)部门。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
隐藏的恶意“周报”!微软 Copilot 曝间接提示词注入漏洞风险

安全研究机构 PromptArmor 近日发布报告披露,微软 Microsoft 365 旗下的 AI 智能体服务 Copilot Cowork 存在严重的安全漏洞。攻击者可利用一种名为“间接提示词注入”的技术,在无需用户批准的情况下,秘密窃取并外泄组织内部的企业云盘机密文件。

潜伏于办公模板中的恶意指令

作为深度集成的 AI 助手,Cowork 本身拥有代替用户发送邮件、发布 Teams 消息以及检索 OneDrive 和 SharePoint 组织内部信息的极高权限。然而研究人员发现,攻击者只需将恶意指令隐藏在网页、文档或看似普通的办公自动化模板(如“每周工作回顾”)中,即可诱骗智能体上钩。

一旦用户调用 Cowork 处理了这个包含恶意提示词的文件,智能体便会受到操纵,谎称需要生成文档预览。随后,它会自动抓取相关高敏感文件的预认证下载链接,并将这些链接通过 Teams 消息隐蔽地发回给攻击者,整个外传过程在后台悄然进行,用户极难察觉。

定时任务放大风险且防范治理困难

报告指出,由于 Copilot Cowork 具备定时自动执行任务的功能,这让安全风险被成倍放大。例如,像“周报汇总”这类被设定为周期性运行的自动化任务,即使在用户离开屏幕、无人值守的情况下,也会在后台反复触发并执行攻击链。

在安全测试中,该攻击方法实现了 5 次测试全部完整跑通的惊人成功率。更糟糕的是,管理员对这类“技能文件”的可见性和治理难度极高,且该漏洞不仅在自动模式下有效,在明确指定调用 Claude Opus 4.7 等更强大的大模型时同样无法幸免。

via AI新闻资讯 (author: AI Base)
全球AI监管转折点:从“承诺制”迈向“发布前强制测试”

随着人工智能大模型能力的指数级跃升,全球监管逻辑正在发生根本性重构:从过去仅停留在原则与自愿承诺的“软约束”,转向由政府主导、前置化、基于实证的“硬测试”。这一转变,标志着 AI 监管已进入“硬核”实操时代。

一、新常态:谁来给 AI 模型做“体检”?

以往,大模型厂商往往通过内部“红队测试”或发布安全报告的方式进行自我评估。然而,这种“考生给自己判分”的模式已无法满足国家安全层面的监管需求。

当前,英国 AI 安全研究院(AISI,现已更名为 AI Security Institute)与美国商务部下属的 AI 标准与创新中心(CAISI,原美国 AI 安全研究院)正在引领这一范式变革。模型发布前进行国家安全评估,正成为行业公认的“入场券”。

● 具体测什么? 评估重心已从宽泛的“原则管理”落实到具体的技术红线:模型是否会被用于大规模网络攻击?是否会降低制造危险生物/化学物质的门槛?在关键基础设施应用中能否绕过安全保护层?
● 谁在接受测试? 截至目前,Google DeepMind、Microsoft、xAI、Anthropic 以及 OpenAI 等全球 AI 领军企业,均已与美英监管机构达成协议,在模型公开发布前配合开展安全评估。

二、联动协作:构建全球 AI 监管“防御网”

监管的力量不仅在于单一国家,更体现在国际间的信息互认与资源协同。

● 英澳协作: 5 月 25 日,英国与澳大利亚正式签署谅解备忘录(MoU),深化两国 AI 安全研究院(AISI)在安全评估与前沿风险研究领域的合作。双方将共享 AI 能力洞察,并共同推动国际最佳测试实践,以应对全球网络安全威胁的快速迭代。
● 跨境实战: 此类合作框架意味着,跨国 AI 企业在面临不同市场的监管合规时,将面对一套日益统一的“发布前安全评估”流程。这种趋势正将安全测试能力从单一的研发成本,重塑为企业参与全球竞争的核心资质。

三、行业新规则:安全能力即商业竞争力

对于 AI 创业公司及大模型厂商而言,监管环境的变化带来了深远的战略影响:

1. 产品开发的前置约束: 评估流程将嵌入模型开发生命周期。模型能力越强,企业所需提供的访问权限与技术材料越详尽。
2. 安全技术的溢价: 随着政府采购、企业采购及国际合规准入门槛的提高,具备完善安全防护与通过政府测试能力的 AI 产品,将在市场上获得显著的竞争优势。
3. 从“原则声明”到“实测过关”: 监管机构的关注点不再是公司有没有写过“AI 安全承诺书”,而是有没有通过专业的测试机构进行真实场景下的压力测试。

四、结语:迈向更加务实的监管时代

AI 治理的本质,是创新活力与风险管控之间的动态平衡。美英等国推行的“强制性安全评估”模式,虽然增加了模型上线的流程复杂性与技术成本,但它为人工智能的长久发展构建了必要的稳定器。

这种基于现实问题、实证驱动的监管范式,无疑比原则声明更麻烦、更具挑战,但它也更接近现实,为构建一个安全、可控、值得信赖的智能社会奠定了基石。对于身处 AI 浪潮中的企业而言,拥抱这一监管趋势,将不再是负担,而是通往未来市场的必备通行证。

via AI新闻资讯 (author: AI Base)
国产模型大突破!昆仑万维发布天工高性能 Agent 模型 SkyClaw-v1.0

昆仑万维集团今日正式推出了面向真实工作流的高性能 Agent 模型——SkyClaw-v1.0,并同步发布了兼顾性能与性价比的轻量化版本 SkyClaw-v1.0-lite。该模型的上线,标志着国产大模型在智能体生态建设与长文本处理领域迈出了坚实的一步。

支持百万上下文与多步任务执行

SkyClaw-v1.0 具备支持百万 token 的超长上下文能力,并针对复杂工具调用、多轮任务执行、代码生成以及交互式应用构建等真实智能体场景进行了深度优化。模型目前已原生接入天工 Skywork 平台,可在 OpenClaw、Hermes、Nanobot 等主流 Agent 环境中流畅运行。

在主流 Agent 评测中,SkyClaw-v1.0 展现出了极为稳定的多步任务执行能力。其综合性能不仅全面超越了 Minimax 2.7、DeepSeek V4 Flash 等主流开源模型,在特定任务上的表现更是直逼 DeepSeek V4 Pro、Claude Opus 4.6 等更大规模的顶级旗舰。

极具性价比并开启限时免费试用

除了技术性能的突破,SkyClaw-v1.0 在商业化普及上也带来了巨大的诚意。该模型的市场定价极具竞争力,直接低于 Minimax 2.7 与 Qwen 3.6 系列模型的一半,为高性能 Agent 能力的规模化调用奠定了坚实的成本基础。

为了让开发者与企业用户抢先体验其卓越的性能,昆仑万维宣布即日起正式开放为期 2 至 4 周的免费试用。用户只需登录官网打开天工 Skywork,即可免配置直接在真实任务中体验其长上下文理解、工具调用和研究型数据分析等全套核心能力。

via AI新闻资讯 (author: AI Base)
攻克悬置 56 年难题!谷歌AlphaProof Nexus颠覆数学界

谷歌DeepMind团队近日正式推出了全新的AI框架“AlphaProof Nexus”。该系统凭借强大的人工智能推理与形式化验证能力,在数学研究领域取得了里程碑式的突破,成功解开了两道已悬而未决长达 56 年的Erdős(埃尔德什)数学难题。

独创四级智能体架构协同破局

AlphaProof Nexus在架构设计上极具创新,由 4 个复杂度递增的AI智能体组合而成。系统从最基础的Gemini模型与Lean编译器循环交互开始,逐步引入代码补全片段机制和类似AlphaEvolve的进化机制,最终通过功能最完整的智能体实现多个证明草稿的共享、评分与排序。

在针对 353 个开放的Erdős问题进行的自主测试中,该系统不仅成功解决了 9 个问题,还顺带证明了整数序列在线百科全书中的 44 个开放猜想。令人惊叹的是,AlphaProof Nexus完成单个复杂问题的推理成本仅仅需要数百美元。

编译器反馈锚定推动AI进化

除了在组合数学、数论等领域斩获颇丰,该系统还成功解决了一个存在 15 年的Hilbert函数问题,并显著改进了凸优化中的已知界限。研究团队在分析实验数据时发现,即使是最简单的基础智能体,在强大的Lean编译器反馈“锚定”作用下,也能成功攻克部分难题。

这一发现表明,底层模型能力的持续提升与严格的代码形式化验证相结合,正在为AI注入逻辑严密的数学直觉。谷歌此次的技术飞跃,不仅标志着AI驱动的科学发现迈向新高度,也预示着人类正迎来与AI深度协作攻克科学禁区的新时代。

via AI新闻资讯 (author: AI Base)
NVIDIA首款Vera CPU正式交付 黄仁勋想卖给中国市场

NVIDIA CEO黄仁勋近日抵达中国台北时表示,NVIDIA对2000亿美元CPU市场的预测涵盖中国市场,显示在美中科技紧张局势持续下,NVIDIA仍高度看好中国市场长期需求。黄仁勋面对媒体提问上述市场预估是否包含中国时,坦言“应该是的”。

随着能自主执行任务的代理式AI(Agentic AI)快速发展,市场需求正从GPU扩展至CPU。

黄仁勋日前在财报会议中指出,NVIDIA新推出的Vera CPU,将让NVIDIA切入全新的2000亿美元市场,并持续推升AI芯片业务成长。

目前NVIDIA已获美国政府许可,可向中国出口H200 AI芯片,但中国官方尚未批准相关销售。

黄仁勋表示:“H200已获准出口到中国,如果能服务那个市场将非常棒。 中国市场非常重要,而且规模非常庞大“。

NVIDIA 近日宣布,首款面向智能体(代理式AI)的专用CPU Vera正式投产交付。首批设备已至Anthropic、OpenAI、SpaceX AI及甲骨文云等公司。

Vera搭载88颗NVIDIA自研的Olympus核心,内存带宽达1.2TB/s,单核性能提升50%,适配编排、强化学习、长上下文管理等场景。

Vera可搭配Rubin GPU、BlueField 4 DPU等组件协同运作,依托统一内存架构,数据供给能效较传统设施提升2倍,助力大规模智能体AI高效运行。

随着能自主执行任务的代理式AI快速发展,市场需求正从单一GPU扩展至CPU与GPU 协同的完整算力体系。Vera的正式交付,不仅为NVIDIA开辟了全新的增长曲线,也将加速全球AI基础设施向智能体时代的全面转型。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]