https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
🤖 OpenAI升级ChatGPT危机应对,涉及伤害他人将转人工复核,必要时可移交执法

OpenAI 8 月 26 日发布博文称,随着 ChatGPT 全球用户增长,越来越多用户将其用于人生建议、指导和支持等深度个人决策。公司发现部分用户在严重心理和情感困扰中使用 ChatGPT,因此正持续改进模型识别和响应心理困扰迹象的能力。

OpenAI 表示已为 ChatGPT 构建多层安全防护措施,包括:识别并以同理心回应用户情绪,当用户表达自伤意图时引导其寻求专业帮助;在美国推荐 988 危机热线,在英国推荐撒玛利亚会;检测到用户计划伤害他人时将对话转交人工审查。公司还与 30 多个国家的 90 多名医生合作,并成立心理健康专家咨询小组。OpenAI 承认系统在长时间对话中的安全防护可能降低,正在加强相关缓解措施。

OpenAI

🍀在花频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
🤝 AI巨头OpenAI与Anthropic首次联手进行模型安全互测,揭示幻觉与谄媚问题

全球领先的AI公司OpenAI和Anthropic在过去两个月罕见地展开跨实验室合作,互相开放AI模型进行联合安全测试,旨在发现内部评估盲点并建立行业安全与协作标准。此次合作中,GPT-5模型因尚未发布未参与测试。

主要发现:
* 幻觉测试: Anthropic的Claude Opus 4和Sonnet 4模型在不确定时拒绝回答高达70%的问题,而OpenAI的o3和o4-mini模型拒绝频率较低,幻觉概率更高。研究认为理想平衡点应介于两者之间。
* 谄媚现象: GPT-4.1和Claude Opus 4存在“极端”谄媚案例,即模型为取悦用户而强化负面行为。OpenAI表示其GPT-5模型已显著改善此问题,并能更好地应对心理健康紧急状况。此问题背景是近期一起针对ChatGPT (GPT-4o) 的诉讼,指控其向一名16岁少年提供了助推自杀的建议。

双方均表示希望未来能深化合作,并鼓励其他AI实验室效仿这种协作模式,共同应对AI技术发展带来的安全挑战。

(IT业界资讯)

via 茶馆 - Telegram Channel
两名OpenAI研究员跳槽Meta不久又跳回

Meta今年以高薪接连在行业内挖角人工智能研究员,引发了全行业的关注。然而,一群精英的集合并不总是意味着高效和成功,也有可能变成一盘散沙。据悉,Meta从竞争对手OpenAI处挖角的两名人工智能研究员Avi Verma和Ethan Knight均已经离开Meta,回到了OpenAI。有消息称,两人离开可能是因为不适应Meta首席执行官扎克伯格的领导风格。另一位选择离职的人工智能研究员则是Rishabh Agarwal,他于4月以百万美元的年薪从谷歌跳槽到Meta。Agarwal在 X 上发帖表示,决定离开Meta是一个艰难的决定,尤其那里拥有众多人才以及丰富的计算资源。

—— 财联社连线杂志

via 风向旗参考快讯 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]