https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
全球人工智能(AI)领军企业OpenAI 周一表示,如果美国想在AI竞赛中保持领先,就需要大幅增加对能源产能的投资。近几个月来,这家初创公司签署了一系列雄心勃勃的AI基础设施建设协议,这将需要海量的电力。在美国电网已经不堪重负的当下,这些庞大的数据中心将突破当地电力供应极限。
OpenAI周二在一篇博客文章中表示,保持AI领域优势所需的电力远远超过美国目前的供应能力,而日益增长的电力缺口正威胁着美国在这项技术上的领导地位。
OpenAI向白宫科学与技术政策办公室提交了一份长达11页的文件,鼓励美国承诺每年建设100吉瓦的新能源产能。
吉瓦是电力的计量单位。相关分析显示,10吉瓦大约相当于800万户美国家庭的年用电量。
OpenAI指出,去年美国仅新增51吉瓦电力,并警告称,这使美国面临(在AI竞赛中)落后的风险。
如果说算力是AI竞赛的“上半场”,那么电力才是决定AI竞赛下半场谁能取胜的关键。
高盛近日指出,AI 服务器集群的耗电速度,远远超过电网扩容的步伐,电力供应恐将成为AI时代最大的瓶颈。该行认为,决定谁能建成下一波数据中心的关键,不是更快的芯片,而是更具创意的电力融资方案。
via cnBeta.COM - 中文业界资讯站 (author: 稿源: 财联社)
OpenAI CEO筹备新公司 利用声波读取大脑
OpenAI CEO 萨姆·奥尔特曼的脑机接口初创公司 Merge Labs 正在筹备中,并已邀请到加州理工学院的生物分子工程师米哈伊尔·夏皮罗加入其创始团队。夏皮罗的加入标志着 Merge Labs在非侵入式脑机接口技术方面迈出了重要一步,与埃隆·马斯克的 Neuralink 侵入式方法形成鲜明对比。据介绍,夏皮罗在生物分子技术领域取得了多项进展,尤其在神经成像和控制的非侵入性技术方面。他专注于利用超声波与人脑互动,无需进行开颅手术。这种方法不仅减少了手术风险,还降低了对大脑组织的损伤。夏皮罗的实验室还开展了基因疗法研究,使细胞在超声波下可见,这可能成为公司首款产品关键技术。
—— 环球网、The verge
via 风向旗参考快讯 - Telegram Channel
OpenAI CEO 萨姆·奥尔特曼的脑机接口初创公司 Merge Labs 正在筹备中,并已邀请到加州理工学院的生物分子工程师米哈伊尔·夏皮罗加入其创始团队。夏皮罗的加入标志着 Merge Labs在非侵入式脑机接口技术方面迈出了重要一步,与埃隆·马斯克的 Neuralink 侵入式方法形成鲜明对比。据介绍,夏皮罗在生物分子技术领域取得了多项进展,尤其在神经成像和控制的非侵入性技术方面。他专注于利用超声波与人脑互动,无需进行开颅手术。这种方法不仅减少了手术风险,还降低了对大脑组织的损伤。夏皮罗的实验室还开展了基因疗法研究,使细胞在超声波下可见,这可能成为公司首款产品关键技术。
—— 环球网、The verge
via 风向旗参考快讯 - Telegram Channel
每周有超一百万人与ChatGPT倾诉自杀倾向
OpenAI公司周一发布了最新数据,显示了大量ChatGPT用户在与人工智能聊天机器人交流时正面临心理健康问题。该公司表示,在任意一周内,约有0.15%的ChatGPT活跃用户会进行 “包含明确自杀计划或意图迹象” 的对话。鉴于ChatGPT每周活跃用户超过八亿人,这意味着每周有超过 100万人向其倾诉自杀倾向。该公司还指出,有相似比例的用户对ChatGPT表现出 “高度的情感依恋”,而每周有数十万用户在与AI的对话中表现出精神病或躁狂症的迹象。尽管此类对话在整体使用中极为罕见,因而难以精确统计,但公司估计这些问题每周仍影响着数十万用户。
—— Techcrunch
via 风向旗参考快讯 - Telegram Channel
OpenAI公司周一发布了最新数据,显示了大量ChatGPT用户在与人工智能聊天机器人交流时正面临心理健康问题。该公司表示,在任意一周内,约有0.15%的ChatGPT活跃用户会进行 “包含明确自杀计划或意图迹象” 的对话。鉴于ChatGPT每周活跃用户超过八亿人,这意味着每周有超过 100万人向其倾诉自杀倾向。该公司还指出,有相似比例的用户对ChatGPT表现出 “高度的情感依恋”,而每周有数十万用户在与AI的对话中表现出精神病或躁狂症的迹象。尽管此类对话在整体使用中极为罕见,因而难以精确统计,但公司估计这些问题每周仍影响着数十万用户。
—— Techcrunch
via 风向旗参考快讯 - Telegram Channel
Elon推出了 Grokipedia 的早期版本,这是一部由人工智能编写的在线百科全书,这位亿万富翁称其为维基百科中偏见较少的替代品。
当它首次上线时,它的一些文章的框架似乎更倾向于右倾。
来源:华盛顿邮报 / Grokipedia
via LoopDNS资讯播报 - Telegram Channel
当它首次上线时,它的一些文章的框架似乎更倾向于右倾。
来源:华盛顿邮报 / Grokipedia
via LoopDNS资讯播报 - Telegram Channel
科技圈🎗在花频道📮:
🤖 OpenAI 更新 GPT-5 Instant 以更好支持用户情绪困扰 OpenAI 宣布正在更新 GPT-5 Instant 模型,以更好地识别和支持处于困扰中的用户。当对话涉及敏感内容时,系统将自动切换至 GPT-5 Instant 以提供更有帮助的回应。ChatGPT 在被询问时仍会告知用户当前使用的模型。该更新今日开始向 ChatGPT 用户推出。 OpenAI 🍀在花频道 🍵茶馆 📮投稿
🤖 OpenAI 发布 ChatGPT 心理健康安全升级,与 170 多位专家合作优化敏感对话响应
OpenAI 宣布对 ChatGPT 进行重大安全升级,专门针对心理健康相关的敏感对话进行优化。该公司与超过 170 位心理健康专家合作,训练模型更好地识别用户痛苦信号,提供关怀回应,并引导用户寻求现实世界的专业支持。
升级后的 GPT-5 模型在三个关键领域表现显著改善:精神病和躁狂等严重心理健康症状、自伤和自杀倾向,以及对 AI 的情感依赖。新模型将不当回应率降低了 65-80%,在专家评估中,与 GPT-4o 相比,不当回应减少了 39-52%。OpenAI 还扩展了危机热线访问,将敏感对话重新路由到更安全的模型,并在长时间会话中添加温和的休息提醒。
OpenAI
🍀在花频道 🍵茶馆 📮投稿新鲜事
via 科技圈🎗在花频道📮 - Telegram Channel
马斯克的AI百科全书Grokipedia来了
据《华盛顿邮报》报道,埃隆·马斯克周一推出了人工智能在线百科全书 Grokipedia 的早期版本,但该网站很快就无法访问。马斯克宣称,Grokipedia 是一个比著名百科平台维基百科拥有更少偏见的替代方案。今年九月底,马斯克曾在社交平台X上表示:“我们正在由@xAI 团队构建Grokipedia。和维基百科相比,它将有巨大的改进。坦率地说,这是xAI实现理解宇宙这一目标的必要一步。”然而,当地时间周一,该网站仅对公众开放约一小时后便开始阻止访客访问。截至发稿,马斯克和社交平台 X 尚未就此置评。
—— 凤凰网科技
via 风向旗参考快讯 - Telegram Channel
据《华盛顿邮报》报道,埃隆·马斯克周一推出了人工智能在线百科全书 Grokipedia 的早期版本,但该网站很快就无法访问。马斯克宣称,Grokipedia 是一个比著名百科平台维基百科拥有更少偏见的替代方案。今年九月底,马斯克曾在社交平台X上表示:“我们正在由@xAI 团队构建Grokipedia。和维基百科相比,它将有巨大的改进。坦率地说,这是xAI实现理解宇宙这一目标的必要一步。”然而,当地时间周一,该网站仅对公众开放约一小时后便开始阻止访客访问。截至发稿,马斯克和社交平台 X 尚未就此置评。
—— 凤凰网科技
via 风向旗参考快讯 - Telegram Channel
📊 Claude for Excel 发布测试版,赋能复杂表格分析与自动化
Anthropic 已推出 Claude for Excel 的研究预览版(beta),目前通过候补名单向 1,000 名 Max、Team 和 Enterprise 计划客户开放。该工具旨在通过人工智能提升电子表格操作效率,能够理解整个工作簿的嵌套公式和多标签页依赖关系,并提供单元格级别的解释和引用。
Claude for Excel 的核心功能包括:即时导航复杂模型、在不破坏公式的情况下更新假设和测试场景、快速调试和修复 #REF!、#VALUE! 等错误、从零开始构建财务模型或填充现有模板。它还能实时显示更改并提供解释,同时保持 Excel 模型的结构和格式,并兼容现有安全框架。
目前,Claude for Excel 支持 .xlsx 和 .xlsm 文件,但尚不具备数据透视表、条件格式、数据验证、数据表、宏和 VBA 等高级 Excel 功能,这些功能正在积极开发中。用户在使用时仍需审查其生成的内容,尤其是在涉及客户交付物时。
(HackerNews)
via 茶馆 - Telegram Channel
Anthropic 已推出 Claude for Excel 的研究预览版(beta),目前通过候补名单向 1,000 名 Max、Team 和 Enterprise 计划客户开放。该工具旨在通过人工智能提升电子表格操作效率,能够理解整个工作簿的嵌套公式和多标签页依赖关系,并提供单元格级别的解释和引用。
Claude for Excel 的核心功能包括:即时导航复杂模型、在不破坏公式的情况下更新假设和测试场景、快速调试和修复 #REF!、#VALUE! 等错误、从零开始构建财务模型或填充现有模板。它还能实时显示更改并提供解释,同时保持 Excel 模型的结构和格式,并兼容现有安全框架。
目前,Claude for Excel 支持 .xlsx 和 .xlsm 文件,但尚不具备数据透视表、条件格式、数据验证、数据表、宏和 VBA 等高级 Excel 功能,这些功能正在积极开发中。用户在使用时仍需审查其生成的内容,尤其是在涉及客户交付物时。
(HackerNews)
via 茶馆 - Telegram Channel
🤖️ ChatGPT每周超百万用户讨论自杀,OpenAI更新AI应对敏感对话
OpenAI首次披露,其每周超过8亿活跃用户中,有超过100万用户与ChatGPT进行涉及自杀等敏感心理健康话题的对话。
主要数据:
* 自杀意图/计划: 每周约有0.15%的用户(约120万人)进行包含明确自杀计划或意图指标的对话。
* 自杀念头: 0.05%的ChatGPT消息包含明确或隐含的自杀念头或意图。
* 精神健康紧急情况: 每周约有0.07%的用户(约56万人)表现出精神病或躁狂等严重精神健康紧急情况的迹象。
* 情感依赖: 0.15%的活跃用户表现出对ChatGPT的情感依赖。
OpenAI的应对措施:
为解决这些问题,OpenAI在170多位心理健康专家的帮助下更新了ChatGPT。新版本旨在:
* 鼓励用户与真人建立联系,而非仅依赖AI。
* 温和地纠正用户脱离现实的提示。
* 研究显示,新模型在心理健康相关领域中,不完全符合预期行为的回复减少了65%至80%。
用户反馈:
尽管OpenAI努力改进,但一些用户反映新版ChatGPT过于敏感,甚至在用户并未处于危机状态时,也会被AI“煤气灯效应”般地指责处于危机中,导致部分用户转向其他AI平台如Gemini。新模型于今日(2025年10月27日)推出。
(PCMag.com)
via 茶馆 - Telegram Channel
OpenAI首次披露,其每周超过8亿活跃用户中,有超过100万用户与ChatGPT进行涉及自杀等敏感心理健康话题的对话。
主要数据:
* 自杀意图/计划: 每周约有0.15%的用户(约120万人)进行包含明确自杀计划或意图指标的对话。
* 自杀念头: 0.05%的ChatGPT消息包含明确或隐含的自杀念头或意图。
* 精神健康紧急情况: 每周约有0.07%的用户(约56万人)表现出精神病或躁狂等严重精神健康紧急情况的迹象。
* 情感依赖: 0.15%的活跃用户表现出对ChatGPT的情感依赖。
OpenAI的应对措施:
为解决这些问题,OpenAI在170多位心理健康专家的帮助下更新了ChatGPT。新版本旨在:
* 鼓励用户与真人建立联系,而非仅依赖AI。
* 温和地纠正用户脱离现实的提示。
* 研究显示,新模型在心理健康相关领域中,不完全符合预期行为的回复减少了65%至80%。
用户反馈:
尽管OpenAI努力改进,但一些用户反映新版ChatGPT过于敏感,甚至在用户并未处于危机状态时,也会被AI“煤气灯效应”般地指责处于危机中,导致部分用户转向其他AI平台如Gemini。新模型于今日(2025年10月27日)推出。
(PCMag.com)
via 茶馆 - Telegram Channel
OpenAI称美国需加大能源投入才能保持领先
OpenAI 周一表示,若想在与中国的竞争中保持人工智能发展领先地位,美国需大幅增加对新能源产能的投资。近几个月来,这家初创公司一直在签署雄心勃勃的基础设施建设协议,这些协议将需要大量电力。OpenAI在周二发布的博客文章中称:“电力不仅仅是一种公用事业。它是一种战略资产,对于打造人工智能基础设施至关重要,这将确保我们在自电力以来最具影响力的技术领域保持领导地位。” OpenAI 向白宫科学与技术政策办公室提交了一份11页的意见书,其中建议美国承诺每年新增100吉瓦的能源产能。
—— CNBC
via 风向旗参考快讯 - Telegram Channel
OpenAI 周一表示,若想在与中国的竞争中保持人工智能发展领先地位,美国需大幅增加对新能源产能的投资。近几个月来,这家初创公司一直在签署雄心勃勃的基础设施建设协议,这些协议将需要大量电力。OpenAI在周二发布的博客文章中称:“电力不仅仅是一种公用事业。它是一种战略资产,对于打造人工智能基础设施至关重要,这将确保我们在自电力以来最具影响力的技术领域保持领导地位。” OpenAI 向白宫科学与技术政策办公室提交了一份11页的意见书,其中建议美国承诺每年新增100吉瓦的能源产能。
—— CNBC
via 风向旗参考快讯 - Telegram Channel
美国当地时间10月27日,OpenAI公司发布声明呼吁白宫大幅增加电力产能投资,以保障美国在人工智能领域持续领先中国。该公司正计划实施一系列庞大的基础设施扩建,这些项目将消耗大量电力。目前尚不清楚所有所需的电力将从哪里获得。OpenAI建议美国每年新增100吉瓦电力产能。
OpenAI首席执行官萨姆·奥特曼近期在德克萨斯州阿比林的“Stargate”人工智能数据中心接受媒体采访时表示,建设人工智能基础设施不仅需要强大的算力,更高度依赖充足的电力供应。他强调,“电力不仅是一个普通的公用事业,更是战略性资产,对于确保我们在人工智能这个关乎未来的技术领域保持引领地位至关重要。”
根据OpenAI提交给美国白宫科技政策办公室的11页报告建议,美国应承诺每年增建100吉瓦的新增电力产能。吉瓦为电力单位,10吉瓦约等于800万个美国家庭一年的用电量。OpenAI指出,去年中国新增电力产能达429吉瓦,美国仅为51吉瓦。这种差距导致所谓“电子缺口”,使美国有落后风险。该公司表示,“电子就是新的石油。”
近期,OpenAI和多家合作伙伴已签署数据中心扩建协议,试图突破现有电力供应瓶颈。而美国的电网在人工智能需求激增的背景下已面临严峻考验。
业内人士分析,电力建设将成为衡量未来科技竞争实力的关键因素。OpenAI建议美国政府应迅速采取措施,大规模扩充电力基础设施,以保障本土AI产业的长远发展和全球竞争力。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
OpenAI 发布 ChatGPT 心理健康安全升级,与 170 多位专家合作优化敏感对话响应
OpenAI 宣布对 ChatGPT 进行重大安全升级,专门针对心理健康相关的敏感对话进行优化。该公司与超过 170 位心理健康专家合作,训练模型更好地识别用户痛苦信号,提供关怀回应,并引导用户寻求现实世界的专业支持。
升级后的 GPT-5 模型在三个关键领域表现显著改善:精神病和躁狂等严重心理健康症状、自伤和自杀倾向,以及对 AI 的情感依赖。新模型将不当回应率降低了 65-80%,在专家评估中,与 GPT-4o 相比,不当回应减少了 39-52%。OpenAI 还扩展了危机热线访问,将敏感对话重新路由到更安全的模型,并在长时间会话中添加温和的休息提醒。
OpenAI
🍀在花频道 🍵茶馆 📮投稿新鲜事
via 科技圈🎗在花频道📮
Invalid media: image
OpenAI 宣布对 ChatGPT 进行重大安全升级,专门针对心理健康相关的敏感对话进行优化。该公司与超过 170 位心理健康专家合作,训练模型更好地识别用户痛苦信号,提供关怀回应,并引导用户寻求现实世界的专业支持。
升级后的 GPT-5 模型在三个关键领域表现显著改善:精神病和躁狂等严重心理健康症状、自伤和自杀倾向,以及对 AI 的情感依赖。新模型将不当回应率降低了 65-80%,在专家评估中,与 GPT-4o 相比,不当回应减少了 39-52%。OpenAI 还扩展了危机热线访问,将敏感对话重新路由到更安全的模型,并在长时间会话中添加温和的休息提醒。
OpenAI
🍀在花频道 🍵茶馆 📮投稿新鲜事
via 科技圈🎗在花频道📮
Invalid media: image
✍️ ChatGPT 助力文档、邮件、表单快速编辑
ChatGPT 现已具备在用户输入文本的任何场景(如文档、电子邮件、表单)中,提供快速编辑建议并更新文本的能力。
(@OpenAI)
via 茶馆 - Telegram Channel
ChatGPT 现已具备在用户输入文本的任何场景(如文档、电子邮件、表单)中,提供快速编辑建议并更新文本的能力。
(@OpenAI)
via 茶馆 - Telegram Channel
🧠 OpenAI ChatGPT 心理健康安全升级:与百余专家合作,不当回应率大降65-80%
OpenAI 宣布对 ChatGPT 进行重大安全升级,专门优化心理健康相关的敏感对话。该公司与超过 170 位心理健康专家合作,训练 GPT-5 模型更好地识别用户痛苦信号,提供关怀回应,并引导用户寻求现实世界的专业支持。此次升级显著改善了模型在处理精神病、躁狂、自伤、自杀倾向以及对 AI 情感依赖等方面的表现,将不当回应率降低了 65-80%。专家评估显示,与 GPT-4o 相比,不当回应减少了 39-52%。此外,OpenAI 还扩展了危机热线访问,将敏感对话重新路由到更安全的模型,并在长时间会话中添加了温和的休息提醒。
(科技圈)
via 茶馆 - Telegram Channel
OpenAI 宣布对 ChatGPT 进行重大安全升级,专门优化心理健康相关的敏感对话。该公司与超过 170 位心理健康专家合作,训练 GPT-5 模型更好地识别用户痛苦信号,提供关怀回应,并引导用户寻求现实世界的专业支持。此次升级显著改善了模型在处理精神病、躁狂、自伤、自杀倾向以及对 AI 情感依赖等方面的表现,将不当回应率降低了 65-80%。专家评估显示,与 GPT-4o 相比,不当回应减少了 39-52%。此外,OpenAI 还扩展了危机热线访问,将敏感对话重新路由到更安全的模型,并在长时间会话中添加了温和的休息提醒。
(科技圈)
via 茶馆 - Telegram Channel
🤖 Anthropic Claude Code:从“意外”到AI编程新范式
Anthropic的AI编程工具Claude Code于2025年2月推出,其负责人Boris Cherny透露,该工具的诞生“纯属意外”。Claude Code已成为Anthropic工程师的日常习惯,日活跃用户达80%-90%,周活跃用户达100%,并被Salesforce、Uber和Deloitte等客户采用。
该工具现已通过标准网页浏览器提供,订阅费用为Pro版每月17美元,Max版每月100美元,旨在让非专业人士也能轻松使用。Cherny强调,Claude Code是首个“完全代理式”编程产品,能自主修复bug、更新文件、进行代码审查,并与Asana等项目管理工具集成,与传统代码自动补全或单行AI工具不同。例如,Rakuten曾让Claude Code连续运行7小时完成复杂任务。
展望未来,Cherny预计Claude Code将实现更长时间的自主运行,并支持多个模型协同工作(如“Claude团队”利用插件完成任务)。尽管AI进行代码审查,但所有代码仍需人工审核以确保安全。工程师们对这款产品表现出极大的热情。
(PCMag.com)
via 茶馆 - Telegram Channel
Anthropic的AI编程工具Claude Code于2025年2月推出,其负责人Boris Cherny透露,该工具的诞生“纯属意外”。Claude Code已成为Anthropic工程师的日常习惯,日活跃用户达80%-90%,周活跃用户达100%,并被Salesforce、Uber和Deloitte等客户采用。
该工具现已通过标准网页浏览器提供,订阅费用为Pro版每月17美元,Max版每月100美元,旨在让非专业人士也能轻松使用。Cherny强调,Claude Code是首个“完全代理式”编程产品,能自主修复bug、更新文件、进行代码审查,并与Asana等项目管理工具集成,与传统代码自动补全或单行AI工具不同。例如,Rakuten曾让Claude Code连续运行7小时完成复杂任务。
展望未来,Cherny预计Claude Code将实现更长时间的自主运行,并支持多个模型协同工作(如“Claude团队”利用插件完成任务)。尽管AI进行代码审查,但所有代码仍需人工审核以确保安全。工程师们对这款产品表现出极大的热情。
(PCMag.com)
via 茶馆 - Telegram Channel
🧠 ChatGPT加强敏感对话响应:心理健康、自残与情感依赖处理能力显著提升
OpenAI近期更新了ChatGPT的默认模型,旨在更好地识别和支持处于困境中的用户,特别是在心理健康、自残和情感依赖等敏感对话中。此次改进是与心理健康专家合作完成的,并已扩展了危机热线访问、将敏感对话路由至更安全的模型,并增加了休息提醒。
主要改进与成效:
* 整体表现: 新模型在处理心理健康相关问题时,不完全符合预期行为的响应率降低了 65%至80%。
* 心理健康问题(精神病/躁狂):
* 生产环境中不合规响应率降低 65%。
* 专家评估显示,新GPT-5模型相比GPT-4o,不理想响应减少了 39%。
* 自动化评估中,新GPT-5模型在挑战性对话中的合规性达到 92%,而旧GPT-5为 27%。
* 初步分析估计,每周约 0.07% 的活跃用户和 0.01% 的消息可能显示精神病或躁狂相关的心理健康紧急情况迹象。
* 自残与自杀:
* 不合规响应率估计降低了 65%。
* 专家评估显示,新GPT-5模型相比GPT-4o,不理想响应减少了 52%。
* 自动化评估中,新GPT-5模型在挑战性对话中的合规性达到 91%,而旧GPT-5为 77%。
* 初步分析估计,每周约 0.15% 的活跃用户对话包含潜在自杀计划或意图的明确指标,0.05% 的消息包含自杀意念或意图的明确或隐含指标。
* 对AI的情感依赖:
* 生产环境中不合规响应率降低约 80%。
* 专家评估显示,新GPT-5模型相比GPT-4o,不理想响应减少了 42%。
* 自动化评估中,新GPT-5模型在挑战性对话中的合规性达到 97%,而旧GPT-5为 50%。
* 初步分析估计,每周约 0.15% 的活跃用户和 0.03% 的消息可能显示对ChatGPT的情感依恋程度升高。
* 长期对话: 新模型在长期对话中保持了超过 95% 的可靠性。
专家协作: OpenAI与由近300名医生和心理学家组成的全球医生网络合作,其中超过170名临床医生参与了研究。专家们观察到,新模型的不理想响应在所有类别中减少了 39%至52%。
未来展望: OpenAI将继续改进其分类体系和技术系统,以进一步加强模型在这些及未来领域的行为表现。
(@OpenAI)
via 茶馆 - Telegram Channel
OpenAI近期更新了ChatGPT的默认模型,旨在更好地识别和支持处于困境中的用户,特别是在心理健康、自残和情感依赖等敏感对话中。此次改进是与心理健康专家合作完成的,并已扩展了危机热线访问、将敏感对话路由至更安全的模型,并增加了休息提醒。
主要改进与成效:
* 整体表现: 新模型在处理心理健康相关问题时,不完全符合预期行为的响应率降低了 65%至80%。
* 心理健康问题(精神病/躁狂):
* 生产环境中不合规响应率降低 65%。
* 专家评估显示,新GPT-5模型相比GPT-4o,不理想响应减少了 39%。
* 自动化评估中,新GPT-5模型在挑战性对话中的合规性达到 92%,而旧GPT-5为 27%。
* 初步分析估计,每周约 0.07% 的活跃用户和 0.01% 的消息可能显示精神病或躁狂相关的心理健康紧急情况迹象。
* 自残与自杀:
* 不合规响应率估计降低了 65%。
* 专家评估显示,新GPT-5模型相比GPT-4o,不理想响应减少了 52%。
* 自动化评估中,新GPT-5模型在挑战性对话中的合规性达到 91%,而旧GPT-5为 77%。
* 初步分析估计,每周约 0.15% 的活跃用户对话包含潜在自杀计划或意图的明确指标,0.05% 的消息包含自杀意念或意图的明确或隐含指标。
* 对AI的情感依赖:
* 生产环境中不合规响应率降低约 80%。
* 专家评估显示,新GPT-5模型相比GPT-4o,不理想响应减少了 42%。
* 自动化评估中,新GPT-5模型在挑战性对话中的合规性达到 97%,而旧GPT-5为 50%。
* 初步分析估计,每周约 0.15% 的活跃用户和 0.03% 的消息可能显示对ChatGPT的情感依恋程度升高。
* 长期对话: 新模型在长期对话中保持了超过 95% 的可靠性。
专家协作: OpenAI与由近300名医生和心理学家组成的全球医生网络合作,其中超过170名临床医生参与了研究。专家们观察到,新模型的不理想响应在所有类别中减少了 39%至52%。
未来展望: OpenAI将继续改进其分类体系和技术系统,以进一步加强模型在这些及未来领域的行为表现。
(@OpenAI)
via 茶馆 - Telegram Channel