🧠 ChatGPT加强敏感对话响应:心理健康、自残与情感依赖处理能力显著提升

OpenAI近期更新了ChatGPT的默认模型,旨在更好地识别和支持处于困境中的用户,特别是在心理健康、自残和情感依赖等敏感对话中。此次改进是与心理健康专家合作完成的,并已扩展了危机热线访问、将敏感对话路由至更安全的模型,并增加了休息提醒。

主要改进与成效:

* 整体表现: 新模型在处理心理健康相关问题时,不完全符合预期行为的响应率降低了 65%至80%
* 心理健康问题(精神病/躁狂):
* 生产环境中不合规响应率降低 65%
* 专家评估显示,新GPT-5模型相比GPT-4o,不理想响应减少了 39%
* 自动化评估中,新GPT-5模型在挑战性对话中的合规性达到 92%,而旧GPT-5为 27%
* 初步分析估计,每周约 0.07% 的活跃用户和 0.01% 的消息可能显示精神病或躁狂相关的心理健康紧急情况迹象。
* 自残与自杀:
* 不合规响应率估计降低了 65%
* 专家评估显示,新GPT-5模型相比GPT-4o,不理想响应减少了 52%
* 自动化评估中,新GPT-5模型在挑战性对话中的合规性达到 91%,而旧GPT-5为 77%
* 初步分析估计,每周约 0.15% 的活跃用户对话包含潜在自杀计划或意图的明确指标,0.05% 的消息包含自杀意念或意图的明确或隐含指标。
* 对AI的情感依赖:
* 生产环境中不合规响应率降低约 80%
* 专家评估显示,新GPT-5模型相比GPT-4o,不理想响应减少了 42%
* 自动化评估中,新GPT-5模型在挑战性对话中的合规性达到 97%,而旧GPT-5为 50%
* 初步分析估计,每周约 0.15% 的活跃用户和 0.03% 的消息可能显示对ChatGPT的情感依恋程度升高。
* 长期对话: 新模型在长期对话中保持了超过 95% 的可靠性。

专家协作: OpenAI与由近300名医生和心理学家组成的全球医生网络合作,其中超过170名临床医生参与了研究。专家们观察到,新模型的不理想响应在所有类别中减少了 39%至52%

未来展望: OpenAI将继续改进其分类体系和技术系统,以进一步加强模型在这些及未来领域的行为表现。

(@OpenAI)

via 茶馆 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]