🧠 ChatGPT加强敏感对话响应:心理健康、自残与情感依赖处理能力显著提升
OpenAI近期更新了ChatGPT的默认模型,旨在更好地识别和支持处于困境中的用户,特别是在心理健康、自残和情感依赖等敏感对话中。此次改进是与心理健康专家合作完成的,并已扩展了危机热线访问、将敏感对话路由至更安全的模型,并增加了休息提醒。
主要改进与成效:
* 整体表现: 新模型在处理心理健康相关问题时,不完全符合预期行为的响应率降低了 65%至80%。
* 心理健康问题(精神病/躁狂):
* 生产环境中不合规响应率降低 65%。
* 专家评估显示,新GPT-5模型相比GPT-4o,不理想响应减少了 39%。
* 自动化评估中,新GPT-5模型在挑战性对话中的合规性达到 92%,而旧GPT-5为 27%。
* 初步分析估计,每周约 0.07% 的活跃用户和 0.01% 的消息可能显示精神病或躁狂相关的心理健康紧急情况迹象。
* 自残与自杀:
* 不合规响应率估计降低了 65%。
* 专家评估显示,新GPT-5模型相比GPT-4o,不理想响应减少了 52%。
* 自动化评估中,新GPT-5模型在挑战性对话中的合规性达到 91%,而旧GPT-5为 77%。
* 初步分析估计,每周约 0.15% 的活跃用户对话包含潜在自杀计划或意图的明确指标,0.05% 的消息包含自杀意念或意图的明确或隐含指标。
* 对AI的情感依赖:
* 生产环境中不合规响应率降低约 80%。
* 专家评估显示,新GPT-5模型相比GPT-4o,不理想响应减少了 42%。
* 自动化评估中,新GPT-5模型在挑战性对话中的合规性达到 97%,而旧GPT-5为 50%。
* 初步分析估计,每周约 0.15% 的活跃用户和 0.03% 的消息可能显示对ChatGPT的情感依恋程度升高。
* 长期对话: 新模型在长期对话中保持了超过 95% 的可靠性。
专家协作: OpenAI与由近300名医生和心理学家组成的全球医生网络合作,其中超过170名临床医生参与了研究。专家们观察到,新模型的不理想响应在所有类别中减少了 39%至52%。
未来展望: OpenAI将继续改进其分类体系和技术系统,以进一步加强模型在这些及未来领域的行为表现。
(@OpenAI)
via 茶馆 - Telegram Channel
OpenAI近期更新了ChatGPT的默认模型,旨在更好地识别和支持处于困境中的用户,特别是在心理健康、自残和情感依赖等敏感对话中。此次改进是与心理健康专家合作完成的,并已扩展了危机热线访问、将敏感对话路由至更安全的模型,并增加了休息提醒。
主要改进与成效:
* 整体表现: 新模型在处理心理健康相关问题时,不完全符合预期行为的响应率降低了 65%至80%。
* 心理健康问题(精神病/躁狂):
* 生产环境中不合规响应率降低 65%。
* 专家评估显示,新GPT-5模型相比GPT-4o,不理想响应减少了 39%。
* 自动化评估中,新GPT-5模型在挑战性对话中的合规性达到 92%,而旧GPT-5为 27%。
* 初步分析估计,每周约 0.07% 的活跃用户和 0.01% 的消息可能显示精神病或躁狂相关的心理健康紧急情况迹象。
* 自残与自杀:
* 不合规响应率估计降低了 65%。
* 专家评估显示,新GPT-5模型相比GPT-4o,不理想响应减少了 52%。
* 自动化评估中,新GPT-5模型在挑战性对话中的合规性达到 91%,而旧GPT-5为 77%。
* 初步分析估计,每周约 0.15% 的活跃用户对话包含潜在自杀计划或意图的明确指标,0.05% 的消息包含自杀意念或意图的明确或隐含指标。
* 对AI的情感依赖:
* 生产环境中不合规响应率降低约 80%。
* 专家评估显示,新GPT-5模型相比GPT-4o,不理想响应减少了 42%。
* 自动化评估中,新GPT-5模型在挑战性对话中的合规性达到 97%,而旧GPT-5为 50%。
* 初步分析估计,每周约 0.15% 的活跃用户和 0.03% 的消息可能显示对ChatGPT的情感依恋程度升高。
* 长期对话: 新模型在长期对话中保持了超过 95% 的可靠性。
专家协作: OpenAI与由近300名医生和心理学家组成的全球医生网络合作,其中超过170名临床医生参与了研究。专家们观察到,新模型的不理想响应在所有类别中减少了 39%至52%。
未来展望: OpenAI将继续改进其分类体系和技术系统,以进一步加强模型在这些及未来领域的行为表现。
(@OpenAI)
via 茶馆 - Telegram Channel