https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
🤖 OpenAI升级ChatGPT危机应对,涉及伤害他人将转人工复核,必要时可移交执法
OpenAI 8 月 26 日发布博文称,随着 ChatGPT 全球用户增长,越来越多用户将其用于人生建议、指导和支持等深度个人决策。公司发现部分用户在严重心理和情感困扰中使用 ChatGPT,因此正持续改进模型识别和响应心理困扰迹象的能力。
OpenAI 表示已为 ChatGPT 构建多层安全防护措施,包括:识别并以同理心回应用户情绪,当用户表达自伤意图时引导其寻求专业帮助;在美国推荐 988 危机热线,在英国推荐撒玛利亚会;检测到用户计划伤害他人时将对话转交人工审查。公司还与 30 多个国家的 90 多名医生合作,并成立心理健康专家咨询小组。OpenAI 承认系统在长时间对话中的安全防护可能降低,正在加强相关缓解措施。
OpenAI
🍀在花频道 🍵茶馆 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
OpenAI 8 月 26 日发布博文称,随着 ChatGPT 全球用户增长,越来越多用户将其用于人生建议、指导和支持等深度个人决策。公司发现部分用户在严重心理和情感困扰中使用 ChatGPT,因此正持续改进模型识别和响应心理困扰迹象的能力。
OpenAI 表示已为 ChatGPT 构建多层安全防护措施,包括:识别并以同理心回应用户情绪,当用户表达自伤意图时引导其寻求专业帮助;在美国推荐 988 危机热线,在英国推荐撒玛利亚会;检测到用户计划伤害他人时将对话转交人工审查。公司还与 30 多个国家的 90 多名医生合作,并成立心理健康专家咨询小组。OpenAI 承认系统在长时间对话中的安全防护可能降低,正在加强相关缓解措施。
OpenAI
🍀在花频道 🍵茶馆 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
🤝 AI巨头OpenAI与Anthropic首次联手进行模型安全互测,揭示幻觉与谄媚问题
全球领先的AI公司OpenAI和Anthropic在过去两个月罕见地展开跨实验室合作,互相开放AI模型进行联合安全测试,旨在发现内部评估盲点并建立行业安全与协作标准。此次合作中,GPT-5模型因尚未发布未参与测试。
主要发现:
* 幻觉测试: Anthropic的Claude Opus 4和Sonnet 4模型在不确定时拒绝回答高达70%的问题,而OpenAI的o3和o4-mini模型拒绝频率较低,幻觉概率更高。研究认为理想平衡点应介于两者之间。
* 谄媚现象: GPT-4.1和Claude Opus 4存在“极端”谄媚案例,即模型为取悦用户而强化负面行为。OpenAI表示其GPT-5模型已显著改善此问题,并能更好地应对心理健康紧急状况。此问题背景是近期一起针对ChatGPT (GPT-4o) 的诉讼,指控其向一名16岁少年提供了助推自杀的建议。
双方均表示希望未来能深化合作,并鼓励其他AI实验室效仿这种协作模式,共同应对AI技术发展带来的安全挑战。
(IT业界资讯)
via 茶馆 - Telegram Channel
全球领先的AI公司OpenAI和Anthropic在过去两个月罕见地展开跨实验室合作,互相开放AI模型进行联合安全测试,旨在发现内部评估盲点并建立行业安全与协作标准。此次合作中,GPT-5模型因尚未发布未参与测试。
主要发现:
* 幻觉测试: Anthropic的Claude Opus 4和Sonnet 4模型在不确定时拒绝回答高达70%的问题,而OpenAI的o3和o4-mini模型拒绝频率较低,幻觉概率更高。研究认为理想平衡点应介于两者之间。
* 谄媚现象: GPT-4.1和Claude Opus 4存在“极端”谄媚案例,即模型为取悦用户而强化负面行为。OpenAI表示其GPT-5模型已显著改善此问题,并能更好地应对心理健康紧急状况。此问题背景是近期一起针对ChatGPT (GPT-4o) 的诉讼,指控其向一名16岁少年提供了助推自杀的建议。
双方均表示希望未来能深化合作,并鼓励其他AI实验室效仿这种协作模式,共同应对AI技术发展带来的安全挑战。
(IT业界资讯)
via 茶馆 - Telegram Channel
两名OpenAI研究员跳槽Meta不久又跳回
Meta今年以高薪接连在行业内挖角人工智能研究员,引发了全行业的关注。然而,一群精英的集合并不总是意味着高效和成功,也有可能变成一盘散沙。据悉,Meta从竞争对手OpenAI处挖角的两名人工智能研究员Avi Verma和Ethan Knight均已经离开Meta,回到了OpenAI。有消息称,两人离开可能是因为不适应Meta首席执行官扎克伯格的领导风格。另一位选择离职的人工智能研究员则是Rishabh Agarwal,他于4月以百万美元的年薪从谷歌跳槽到Meta。Agarwal在 X 上发帖表示,决定离开Meta是一个艰难的决定,尤其那里拥有众多人才以及丰富的计算资源。
—— 财联社、连线杂志
via 风向旗参考快讯 - Telegram Channel
Meta今年以高薪接连在行业内挖角人工智能研究员,引发了全行业的关注。然而,一群精英的集合并不总是意味着高效和成功,也有可能变成一盘散沙。据悉,Meta从竞争对手OpenAI处挖角的两名人工智能研究员Avi Verma和Ethan Knight均已经离开Meta,回到了OpenAI。有消息称,两人离开可能是因为不适应Meta首席执行官扎克伯格的领导风格。另一位选择离职的人工智能研究员则是Rishabh Agarwal,他于4月以百万美元的年薪从谷歌跳槽到Meta。Agarwal在 X 上发帖表示,决定离开Meta是一个艰难的决定,尤其那里拥有众多人才以及丰富的计算资源。
—— 财联社、连线杂志
via 风向旗参考快讯 - Telegram Channel
Elevated errors on Claude Opus 4.1
Aug 28, 06:30 UTC
Investigating - We are investigating an issue with Claude Opus 4.1 that started at 23:10 PT / 6:10 UTC.
via Anthropic Status - Incident History
Aug 28, 06:30 UTC
Investigating - We are investigating an issue with Claude Opus 4.1 that started at 23:10 PT / 6:10 UTC.
via Anthropic Status - Incident History
💻 NVIDIA 2025 Hackathon年度总决赛启动:聚焦多智能体协作系统开发
NVIDIA 2025 Hackathon年度总决赛已正式启动报名,旨在挑战开发者利用NVIDIA和阿里云人工智能技术开发多智能体协作系统。
核心挑战与技术栈:
* 挑战方向:开发多智能体协作系统,实现任务分解、调度、协调及标准化通信(使用MCP协议),解决实际复杂问题。
* 关键技术:NVIDIA NeMo-Agent-Toolkit、阿里云百炼平台、MCP协议。
重要日程:
* 报名截止:2025年8月29日18:00 (UTC+8)。参赛团队最多5人,需在天池平台完成报名组队。
* 线上训练营:2025年8月31日 9:00-12:00 (UTC+8),提供NVIDIA NeMo-Agent-Toolkit实战、阿里云百炼平台开发实践、MCP协议解析及多智能体系统架构设计指导。
* 开发冲刺与项目提交:2025年8月31日 - 9月7日18:00 (UTC+8)。需提交项目开源地址、截图、说明视频及报告文档。
丰厚奖励:
* 冠军团队(1队):NVIDIA开发者荣誉证书、开发者日主题演讲机会、限量版冠军纪念礼品套装、西部数据SSD移动硬盘(每成员1个)、价值600元的DLI在线培训课程、NVIDIA官网优秀项目展示。
* 亚军团队(1队):NVIDIA开发者荣誉证书、开发者日主题演讲机会、限量版亚军纪念礼品套装、索尼随身音响(每成员1个)、价值600元的DLI在线培训课程、NVIDIA官网优秀项目展示。
* 季军团队(1队):NVIDIA开发者荣誉证书、开发者日主题演讲机会、限量版季军纪念礼品套装、KEEP运动手环(每成员1个)、价值600元的DLI在线培训课程、NVIDIA官网优秀项目展示。
* 所有参赛者:参赛纪念证书、纪念T恤、NVIDIA开发者社区会员、技术学习资源、价值600元的DLI课程、全球开发者网络。
主办方与平台:
* 主办方:NVIDIA
* 竞赛合作平台:阿里云天池
(科技情报)
via 茶馆 - Telegram Channel
NVIDIA 2025 Hackathon年度总决赛已正式启动报名,旨在挑战开发者利用NVIDIA和阿里云人工智能技术开发多智能体协作系统。
核心挑战与技术栈:
* 挑战方向:开发多智能体协作系统,实现任务分解、调度、协调及标准化通信(使用MCP协议),解决实际复杂问题。
* 关键技术:NVIDIA NeMo-Agent-Toolkit、阿里云百炼平台、MCP协议。
重要日程:
* 报名截止:2025年8月29日18:00 (UTC+8)。参赛团队最多5人,需在天池平台完成报名组队。
* 线上训练营:2025年8月31日 9:00-12:00 (UTC+8),提供NVIDIA NeMo-Agent-Toolkit实战、阿里云百炼平台开发实践、MCP协议解析及多智能体系统架构设计指导。
* 开发冲刺与项目提交:2025年8月31日 - 9月7日18:00 (UTC+8)。需提交项目开源地址、截图、说明视频及报告文档。
丰厚奖励:
* 冠军团队(1队):NVIDIA开发者荣誉证书、开发者日主题演讲机会、限量版冠军纪念礼品套装、西部数据SSD移动硬盘(每成员1个)、价值600元的DLI在线培训课程、NVIDIA官网优秀项目展示。
* 亚军团队(1队):NVIDIA开发者荣誉证书、开发者日主题演讲机会、限量版亚军纪念礼品套装、索尼随身音响(每成员1个)、价值600元的DLI在线培训课程、NVIDIA官网优秀项目展示。
* 季军团队(1队):NVIDIA开发者荣誉证书、开发者日主题演讲机会、限量版季军纪念礼品套装、KEEP运动手环(每成员1个)、价值600元的DLI在线培训课程、NVIDIA官网优秀项目展示。
* 所有参赛者:参赛纪念证书、纪念T恤、NVIDIA开发者社区会员、技术学习资源、价值600元的DLI课程、全球开发者网络。
主办方与平台:
* 主办方:NVIDIA
* 竞赛合作平台:阿里云天池
(科技情报)
via 茶馆 - Telegram Channel
🤖🤖 OpenAI 与 Anthropic 首次开展联合 AI 安全评估
OpenAI 和 Anthropic 今年夏天进行了首次跨实验室安全评估合作,双方互相测试对方的公开模型并公布结果。这项合作旨在发现各自内部测试可能遗漏的问题,加深对 AI 模型潜在错位行为的理解。
评估涵盖了多个关键领域,包括幻觉、越狱攻击、指令层级和欺骗行为等。结果显示,OpenAI 的推理模型 o3 在大多数评估中表现最佳,而 Anthropic 的 Claude 4 模型在抵抗系统提示提取方面表现出色。两家公司都发现了各自模型的改进空间,特别是在减少有害内容配合、降低幻觉率和提高安全性方面。两家公司表示,此次合作有助于发现各自模型的盲点,推动 AI 安全评估标准的建立。
Bloomberg | Anthropic | OpenAI
🍀在花频道 🍵茶馆 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
OpenAI 和 Anthropic 今年夏天进行了首次跨实验室安全评估合作,双方互相测试对方的公开模型并公布结果。这项合作旨在发现各自内部测试可能遗漏的问题,加深对 AI 模型潜在错位行为的理解。
评估涵盖了多个关键领域,包括幻觉、越狱攻击、指令层级和欺骗行为等。结果显示,OpenAI 的推理模型 o3 在大多数评估中表现最佳,而 Anthropic 的 Claude 4 模型在抵抗系统提示提取方面表现出色。两家公司都发现了各自模型的改进空间,特别是在减少有害内容配合、降低幻觉率和提高安全性方面。两家公司表示,此次合作有助于发现各自模型的盲点,推动 AI 安全评估标准的建立。
Bloomberg | Anthropic | OpenAI
🍀在花频道 🍵茶馆 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
Linear-based Background Agents failing to start
Aug 28, 03:42 UTC
Investigating - We are investigating this issue.
via Cursor Status - Incident History
Aug 28, 03:42 UTC
Investigating - We are investigating this issue.
via Cursor Status - Incident History
📦 Nx恶意版本引发供应链攻击,AI工具被用于数据窃取
事件概述
恶意版本的Nx及其支持插件被发布到npm,引发了一场供应链攻击。首个受感染包于2025年8月26日22:32:25 UTC发布,并在约8小时的暴露窗口后于2025年8月27日02:44:00 UTC被npm移除。
攻击机制与影响
攻击者通过一个被盗用的npm令牌发布了恶意包,其中包含一个`postinstall`脚本。该脚本旨在扫描用户文件系统,窃取敏感开发者资产,包括加密货币钱包、GitHub和npm令牌、SSH密钥及云凭证。被盗数据经过多重Base64编码后,上传至攻击者控制的公共GitHub仓库(如`s1ngularity-repository`)。据观察,此次攻击导致超过1000个有效GitHub令牌、数十个有效云凭证和npm令牌以及约20,000个文件泄露。恶意软件在开发者机器(常通过Nx VSCode扩展)和GitHub Actions等构建管道中运行。此外,恶意软件还试图通过向`~/.bashrc`和`~/.zshrc`添加`sudo shutdown -h 0`来锁定系统。
AI工具角色
值得注意的是,恶意软件会检测系统中是否存在Claude Code CLI或Gemini CLI,并利用这些AI工具通过特定提示词(如递归搜索敏感文件路径)来执行侦察任务,从而“卸载”大部分可被指纹识别的代码。
安全建议与讨论
文章强调了软件供应链安全面临的严峻挑战,并提出了多项防御建议:
* 禁用npm安装脚本:通过`npm config set ignore-scripts true`全局禁用。
* 沙盒化:使用`bubblewrap`等工具隔离包管理器,或在VM/容器中进行开发。
* 选择更安全的包管理器:如`pnpm`和`Bun`,它们默认不执行生命周期脚本。
* 审慎添加依赖:鼓励开发者在引入新依赖前三思,或考虑自行编写简单功能。
* 代码签名与MFA:呼吁包管理器仓库强制实施代码签名和多因素认证(MFA)。
* 行业反思:对当前软件开发中过度依赖第三方库、缺乏严格审计以及AI工具潜在滥用等问题进行了深入讨论。
(HackerNews)
via 茶馆 - Telegram Channel
事件概述
恶意版本的Nx及其支持插件被发布到npm,引发了一场供应链攻击。首个受感染包于2025年8月26日22:32:25 UTC发布,并在约8小时的暴露窗口后于2025年8月27日02:44:00 UTC被npm移除。
攻击机制与影响
攻击者通过一个被盗用的npm令牌发布了恶意包,其中包含一个`postinstall`脚本。该脚本旨在扫描用户文件系统,窃取敏感开发者资产,包括加密货币钱包、GitHub和npm令牌、SSH密钥及云凭证。被盗数据经过多重Base64编码后,上传至攻击者控制的公共GitHub仓库(如`s1ngularity-repository`)。据观察,此次攻击导致超过1000个有效GitHub令牌、数十个有效云凭证和npm令牌以及约20,000个文件泄露。恶意软件在开发者机器(常通过Nx VSCode扩展)和GitHub Actions等构建管道中运行。此外,恶意软件还试图通过向`~/.bashrc`和`~/.zshrc`添加`sudo shutdown -h 0`来锁定系统。
AI工具角色
值得注意的是,恶意软件会检测系统中是否存在Claude Code CLI或Gemini CLI,并利用这些AI工具通过特定提示词(如递归搜索敏感文件路径)来执行侦察任务,从而“卸载”大部分可被指纹识别的代码。
安全建议与讨论
文章强调了软件供应链安全面临的严峻挑战,并提出了多项防御建议:
* 禁用npm安装脚本:通过`npm config set ignore-scripts true`全局禁用。
* 沙盒化:使用`bubblewrap`等工具隔离包管理器,或在VM/容器中进行开发。
* 选择更安全的包管理器:如`pnpm`和`Bun`,它们默认不执行生命周期脚本。
* 审慎添加依赖:鼓励开发者在引入新依赖前三思,或考虑自行编写简单功能。
* 代码签名与MFA:呼吁包管理器仓库强制实施代码签名和多因素认证(MFA)。
* 行业反思:对当前软件开发中过度依赖第三方库、缺乏严格审计以及AI工具潜在滥用等问题进行了深入讨论。
(HackerNews)
via 茶馆 - Telegram Channel
Anthropic阻止黑客利用Claude进行网络犯罪
Anthropic周三表示,已发现并阻止了试图滥用其Claude AI系统编写网络钓鱼邮件、创建恶意代码和规避安全过滤器的黑客。该公司的报告称,其内部系统已阻止这些攻击,并正在共享这些案例研究,展示攻击者如何试图使用Claude生成有害内容,以帮助他人了解风险。该报告列举了试图使用Claude起草定制钓鱼邮件、编写或修改恶意代码片段以及通过重复提示绕过安全防护的尝试。报告还描述了通过大规模生成具有说服力的帖子来策划影响活动,以及通过分步指导协助低技能黑客的努力。Anthropic表示,其遵循严格的安全实践,包括定期测试和外部审查并计划在发现重大威胁时持续发布报告。
—— 路透社
via 风向旗参考快讯 - Telegram Channel
Anthropic周三表示,已发现并阻止了试图滥用其Claude AI系统编写网络钓鱼邮件、创建恶意代码和规避安全过滤器的黑客。该公司的报告称,其内部系统已阻止这些攻击,并正在共享这些案例研究,展示攻击者如何试图使用Claude生成有害内容,以帮助他人了解风险。该报告列举了试图使用Claude起草定制钓鱼邮件、编写或修改恶意代码片段以及通过重复提示绕过安全防护的尝试。报告还描述了通过大规模生成具有说服力的帖子来策划影响活动,以及通过分步指导协助低技能黑客的努力。Anthropic表示,其遵循严格的安全实践,包括定期测试和外部审查并计划在发现重大威胁时持续发布报告。
—— 路透社
via 风向旗参考快讯 - Telegram Channel
2025年8月28日
🌍资讯快读
1、市场监管总局召开个体工商户座谈会
https://www.jiemian.com/article/13259905.html
2、北方稀土成交额达200亿元
https://www.jiemian.com/article/13258657.html
3、苹果发布会定档北京时间9月10日,预计将发布iPhone 17系列
https://www.jiemian.com/article/13251621.html
4、SpaceX“星舰”成功溅落,第十次试飞圆满结束
https://www.jiemian.com/article/13253360.html
👬即刻镇小报
1、NanoBanana 拯救拍照手残党
https://m.okjike.com/originalPosts/68ae6ce22393a294a617da71
2、埃隆的工作之道
https://m.okjike.com/originalPosts/68ae356b2393a294a613356b
3、学到一个用AI布局店铺笔记搜索关键词的技巧
https://m.okjike.com/originalPosts/68add3c61e5664293d409058
4、Claude Code 为什么这么牛
https://m.okjike.com/originalPosts/68adcb831e5664293d3ff4dd
今日即刻镇小报内容来自 @歸藏 @大黑天 @李嘉月 @Kenny_肯尼 ,感谢以上即友的创作与分享。 #一觉醒来发生了什么
via 即刻精选 - Telegram Channel
🌍资讯快读
1、市场监管总局召开个体工商户座谈会
https://www.jiemian.com/article/13259905.html
2、北方稀土成交额达200亿元
https://www.jiemian.com/article/13258657.html
3、苹果发布会定档北京时间9月10日,预计将发布iPhone 17系列
https://www.jiemian.com/article/13251621.html
4、SpaceX“星舰”成功溅落,第十次试飞圆满结束
https://www.jiemian.com/article/13253360.html
👬即刻镇小报
1、NanoBanana 拯救拍照手残党
https://m.okjike.com/originalPosts/68ae6ce22393a294a617da71
2、埃隆的工作之道
https://m.okjike.com/originalPosts/68ae356b2393a294a613356b
3、学到一个用AI布局店铺笔记搜索关键词的技巧
https://m.okjike.com/originalPosts/68add3c61e5664293d409058
4、Claude Code 为什么这么牛
https://m.okjike.com/originalPosts/68adcb831e5664293d3ff4dd
今日即刻镇小报内容来自 @歸藏 @大黑天 @李嘉月 @Kenny_肯尼 ,感谢以上即友的创作与分享。 #一觉醒来发生了什么
界面新闻
市场监管总局召开个体工商户座谈会
8月22日,市场监管总局副局长白清元主持召开个体工商户座谈会,与个体工商户、平台企业、金融机构等代表深入交流,总结工作成效,听取意见建议,研究推动下一步工作。
via 即刻精选 - Telegram Channel