ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

18:20 · 2025年8月28日 · 周四

🤖 OpenAI升级ChatGPT危机应对，涉及伤害他人将转人工复核，必要时可移交执法

OpenAI 8 月 26 日发布博文称，随着 ChatGPT 全球用户增长，越来越多用户将其用于人生建议、指导和支持等深度个人决策。公司发现部分用户在严重心理和情感困扰中使用 ChatGPT，因此正持续改进模型识别和响应心理困扰迹象的能力。

OpenAI 表示已为 ChatGPT 构建多层安全防护措施，包括：识别并以同理心回应用户情绪，当用户表达自伤意图时引导其寻求专业帮助；在美国推荐 988 危机热线，在英国推荐撒玛利亚会；检测到用户计划伤害他人时将对话转交人工审查。公司还与 30 多个国家的 90 多名医生合作，并成立心理健康专家咨询小组。OpenAI 承认系统在长时间对话中的安全防护可能降低，正在加强相关缓解措施。

OpenAI

🍀在花频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel

18:08 · 2025年8月28日 · 周四

🤝 AI巨头OpenAI与Anthropic首次联手进行模型安全互测，揭示幻觉与谄媚问题

全球领先的AI公司OpenAI和Anthropic在过去两个月罕见地展开跨实验室合作，互相开放AI模型进行联合安全测试，旨在发现内部评估盲点并建立行业安全与协作标准。此次合作中，GPT-5模型因尚未发布未参与测试。

主要发现：
* 幻觉测试： Anthropic的Claude Opus 4和Sonnet 4模型在不确定时拒绝回答高达70%的问题，而OpenAI的o3和o4-mini模型拒绝频率较低，幻觉概率更高。研究认为理想平衡点应介于两者之间。
* 谄媚现象： GPT-4.1和Claude Opus 4存在“极端”谄媚案例，即模型为取悦用户而强化负面行为。OpenAI表示其GPT-5模型已显著改善此问题，并能更好地应对心理健康紧急状况。此问题背景是近期一起针对ChatGPT (GPT-4o) 的诉讼，指控其向一名16岁少年提供了助推自杀的建议。

双方均表示希望未来能深化合作，并鼓励其他AI实验室效仿这种协作模式，共同应对AI技术发展带来的安全挑战。

(IT业界资讯)

via 茶馆 - Telegram Channel

17:42 · 2025年8月28日 · 周四

两名OpenAI研究员跳槽Meta不久又跳回

Meta今年以高薪接连在行业内挖角人工智能研究员，引发了全行业的关注。然而，一群精英的集合并不总是意味着高效和成功，也有可能变成一盘散沙。据悉，Meta从竞争对手OpenAI处挖角的两名人工智能研究员Avi Verma和Ethan Knight均已经离开Meta，回到了OpenAI。有消息称，两人离开可能是因为不适应Meta首席执行官扎克伯格的领导风格。另一位选择离职的人工智能研究员则是Rishabh Agarwal，他于4月以百万美元的年薪从谷歌跳槽到Meta。Agarwal在 X 上发帖表示，决定离开Meta是一个艰难的决定，尤其那里拥有众多人才以及丰富的计算资源。

—— 财联社、连线杂志

via 风向旗参考快讯 - Telegram Channel

16:02 · 2025年8月28日 · 周四

营收大涨股价反而下跌英伟达财报里藏着中国难题

via cnBeta.COM - 中文业界资讯站 (author: 稿源：网易科技)

Telegraph

营收大涨股价反而下跌英伟达财报里藏着中国难题

8月28日消息，周三，芯片制造商英伟达公布了截至2025年7月27日的2026财年第二财季财报。财报显示，2026财年第二财季公司营收为467.4亿美元，同比增长56%，超出分析师平均预期的460.6亿美元。按照美国通用会计准则（GAAP）计算，净利润264.22亿美元，同比增长59%；调整后每股收益为1.05美元。英伟达预计2026财年第三财季营收为540亿美元，上下浮动2%，高于分析师平均预期的531亿美元。英伟达表示，第二财季毛利率为72.4%。按业务划分，数据中心业务第二财季营收为411亿…

15:53 · 2025年8月28日 · 周四

OpenAI与Anthropic树立典范 AI老对手间开始“互测”模型安全性

via cnBeta.COM - 中文业界资讯站 (author: 稿源：财联社)

Telegraph

OpenAI与Anthropic树立典范 AI老对手间开始“互测”模型安全性

全球领先的两家AI初创企业OpenAI与Anthropic过去两个月罕见地展开了一项跨实验室的合作——在激烈竞争中暂时互相开放它们严密保护的人工智能模型，以进行联合安全测试。此举旨在揭示各自公司内部评估中的盲点，并展示领先人工智能企业在未来如何在安全与协调方面开展合作。两家公司于周三联合发布的安全研究报告，正值OpenAI与Anthropic等头部AI企业展开军备竞赛之际——数十亿美元的数据中心投资和千万美元级别的顶尖研究员薪酬，已成为业内的基础门槛。这导致不少行业专家颇为担忧地警告称，产品竞争的激烈…

14:34 · 2025年8月28日 · 周四

Elevated errors on Claude Opus 4.1

Aug 28, 06:30 UTC
Investigating - We are investigating an issue with Claude Opus 4.1 that started at 23:10 PT / 6:10 UTC.

via Anthropic Status - Incident History

14:27 · 2025年8月28日 · 周四

💻 NVIDIA 2025 Hackathon年度总决赛启动：聚焦多智能体协作系统开发

NVIDIA 2025 Hackathon年度总决赛已正式启动报名，旨在挑战开发者利用NVIDIA和阿里云人工智能技术开发多智能体协作系统。

核心挑战与技术栈：
* 挑战方向：开发多智能体协作系统，实现任务分解、调度、协调及标准化通信（使用MCP协议），解决实际复杂问题。
* 关键技术：NVIDIA NeMo-Agent-Toolkit、阿里云百炼平台、MCP协议。

重要日程：
* 报名截止：2025年8月29日18:00 (UTC+8)。参赛团队最多5人，需在天池平台完成报名组队。
* 线上训练营：2025年8月31日 9:00-12:00 (UTC+8)，提供NVIDIA NeMo-Agent-Toolkit实战、阿里云百炼平台开发实践、MCP协议解析及多智能体系统架构设计指导。
* 开发冲刺与项目提交：2025年8月31日 - 9月7日18:00 (UTC+8)。需提交项目开源地址、截图、说明视频及报告文档。

丰厚奖励：
* 冠军团队（1队）：NVIDIA开发者荣誉证书、开发者日主题演讲机会、限量版冠军纪念礼品套装、西部数据SSD移动硬盘（每成员1个）、价值600元的DLI在线培训课程、NVIDIA官网优秀项目展示。
* 亚军团队（1队）：NVIDIA开发者荣誉证书、开发者日主题演讲机会、限量版亚军纪念礼品套装、索尼随身音响（每成员1个）、价值600元的DLI在线培训课程、NVIDIA官网优秀项目展示。
* 季军团队（1队）：NVIDIA开发者荣誉证书、开发者日主题演讲机会、限量版季军纪念礼品套装、KEEP运动手环（每成员1个）、价值600元的DLI在线培训课程、NVIDIA官网优秀项目展示。
* 所有参赛者：参赛纪念证书、纪念T恤、NVIDIA开发者社区会员、技术学习资源、价值600元的DLI课程、全球开发者网络。

主办方与平台：
* 主办方：NVIDIA
* 竞赛合作平台：阿里云天池

(科技情报)

via 茶馆 - Telegram Channel

13:27 · 2025年8月28日 · 周四

理想汽车可以写游戏代码了还能直接在车机上玩

8月28日，理想汽车产品线负责人@老汤哥Tango在微博发布”理想同学“写游戏代码的视频，从响应需求到游戏生成持续了约3分钟时间。

据理想官方介绍，理想同学手机、网页端已正式接入DeepSeek R1-0528最新版，切换“DeepSeek模型”并开启“深度思考”模式即可体验最新的AI问答、创作能力。据悉，更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩，并且在整体表现上已接近其他国际顶尖模型，如o3与Gemini-2.5-Pro。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：凤凰网科技)

11:54 · 2025年8月28日 · 周四

🤖🤖 OpenAI 与 Anthropic 首次开展联合 AI 安全评估

OpenAI 和 Anthropic 今年夏天进行了首次跨实验室安全评估合作，双方互相测试对方的公开模型并公布结果。这项合作旨在发现各自内部测试可能遗漏的问题，加深对 AI 模型潜在错位行为的理解。

评估涵盖了多个关键领域，包括幻觉、越狱攻击、指令层级和欺骗行为等。结果显示，OpenAI 的推理模型 o3 在大多数评估中表现最佳，而 Anthropic 的 Claude 4 模型在抵抗系统提示提取方面表现出色。两家公司都发现了各自模型的改进空间，特别是在减少有害内容配合、降低幻觉率和提高安全性方面。两家公司表示，此次合作有助于发现各自模型的盲点，推动 AI 安全评估标准的建立。

Bloomberg | Anthropic | OpenAI

🍀在花频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel

11:51 · 2025年8月28日 · 周四

Linear-based Background Agents failing to start

Aug 28, 03:42 UTC
Investigating - We are investigating this issue.

via Cursor Status - Incident History

10:54 · 2025年8月28日 · 周四

📦 Nx恶意版本引发供应链攻击，AI工具被用于数据窃取

事件概述
恶意版本的Nx及其支持插件被发布到npm，引发了一场供应链攻击。首个受感染包于2025年8月26日22:32:25 UTC发布，并在约8小时的暴露窗口后于2025年8月27日02:44:00 UTC被npm移除。

攻击机制与影响
攻击者通过一个被盗用的npm令牌发布了恶意包，其中包含一个`postinstall`脚本。该脚本旨在扫描用户文件系统，窃取敏感开发者资产，包括加密货币钱包、GitHub和npm令牌、SSH密钥及云凭证。被盗数据经过多重Base64编码后，上传至攻击者控制的公共GitHub仓库（如`s1ngularity-repository`）。据观察，此次攻击导致超过1000个有效GitHub令牌、数十个有效云凭证和npm令牌以及约20,000个文件泄露。恶意软件在开发者机器（常通过Nx VSCode扩展）和GitHub Actions等构建管道中运行。此外，恶意软件还试图通过向`~/.bashrc`和`~/.zshrc`添加`sudo shutdown -h 0`来锁定系统。

AI工具角色
值得注意的是，恶意软件会检测系统中是否存在Claude Code CLI或Gemini CLI，并利用这些AI工具通过特定提示词（如递归搜索敏感文件路径）来执行侦察任务，从而“卸载”大部分可被指纹识别的代码。

安全建议与讨论
文章强调了软件供应链安全面临的严峻挑战，并提出了多项防御建议：
* 禁用npm安装脚本：通过`npm config set ignore-scripts true`全局禁用。
* 沙盒化：使用`bubblewrap`等工具隔离包管理器，或在VM/容器中进行开发。
* 选择更安全的包管理器：如`pnpm`和`Bun`，它们默认不执行生命周期脚本。
* 审慎添加依赖：鼓励开发者在引入新依赖前三思，或考虑自行编写简单功能。
* 代码签名与MFA：呼吁包管理器仓库强制实施代码签名和多因素认证（MFA）。
* 行业反思：对当前软件开发中过度依赖第三方库、缺乏严格审计以及AI工具潜在滥用等问题进行了深入讨论。

(HackerNews)

via 茶馆 - Telegram Channel

08:03 · 2025年8月28日 · 周四

Anthropic阻止黑客利用Claude进行网络犯罪

Anthropic周三表示，已发现并阻止了试图滥用其Claude AI系统编写网络钓鱼邮件、创建恶意代码和规避安全过滤器的黑客。该公司的报告称，其内部系统已阻止这些攻击，并正在共享这些案例研究，展示攻击者如何试图使用Claude生成有害内容，以帮助他人了解风险。该报告列举了试图使用Claude起草定制钓鱼邮件、编写或修改恶意代码片段以及通过重复提示绕过安全防护的尝试。报告还描述了通过大规模生成具有说服力的帖子来策划影响活动，以及通过分步指导协助低技能黑客的努力。Anthropic表示，其遵循严格的安全实践，包括定期测试和外部审查并计划在发现重大威胁时持续发布报告。

—— 路透社

via 风向旗参考快讯 - Telegram Channel

07:51 · 2025年8月28日 · 周四