🧠 ChatGPT加强敏感对话响应：心理健康、自残与情感依赖处理能力显著提升OpenAI近期更新了ChatGPT的默认模型，旨在更好地识别和支持处于困境中的用户，特别是在心理健康、自残和情感依赖等敏感对话中

🧠 ChatGPT加强敏感对话响应：心理健康、自残与情感依赖处理能力显著提升

OpenAI近期更新了ChatGPT的默认模型，旨在更好地识别和支持处于困境中的用户，特别是在心理健康、自残和情感依赖等敏感对话中。此次改进是与心理健康专家合作完成的，并已扩展了危机热线访问、将敏感对话路由至更安全的模型，并增加了休息提醒。

主要改进与成效：

* 整体表现： 新模型在处理心理健康相关问题时，不完全符合预期行为的响应率降低了 65%至80%。
* 心理健康问题（精神病/躁狂）：
* 生产环境中不合规响应率降低 65%。
* 专家评估显示，新GPT-5模型相比GPT-4o，不理想响应减少了 39%。
* 自动化评估中，新GPT-5模型在挑战性对话中的合规性达到 92%，而旧GPT-5为 27%。
* 初步分析估计，每周约 0.07% 的活跃用户和 0.01% 的消息可能显示精神病或躁狂相关的心理健康紧急情况迹象。
* 自残与自杀：
* 不合规响应率估计降低了 65%。
* 专家评估显示，新GPT-5模型相比GPT-4o，不理想响应减少了 52%。
* 自动化评估中，新GPT-5模型在挑战性对话中的合规性达到 91%，而旧GPT-5为 77%。
* 初步分析估计，每周约 0.15% 的活跃用户对话包含潜在自杀计划或意图的明确指标，0.05% 的消息包含自杀意念或意图的明确或隐含指标。
* 对AI的情感依赖：
* 生产环境中不合规响应率降低约 80%。
* 专家评估显示，新GPT-5模型相比GPT-4o，不理想响应减少了 42%。
* 自动化评估中，新GPT-5模型在挑战性对话中的合规性达到 97%，而旧GPT-5为 50%。
* 初步分析估计，每周约 0.15% 的活跃用户和 0.03% 的消息可能显示对ChatGPT的情感依恋程度升高。
* 长期对话： 新模型在长期对话中保持了超过 95% 的可靠性。

专家协作： OpenAI与由近300名医生和心理学家组成的全球医生网络合作，其中超过170名临床医生参与了研究。专家们观察到，新模型的不理想响应在所有类别中减少了 39%至52%。

未来展望： OpenAI将继续改进其分类体系和技术系统，以进一步加强模型在这些及未来领域的行为表现。

(@OpenAI)

via 茶馆 - Telegram Channel