🤖 Stanford 研究:AI 聊天机器人可能违背治疗最佳实践

斯坦福大学的一项新研究表明,包括 OpenAI 的 GPT-4o 和 Meta 的 LLaMA 3 在内的主流 AI 模型在提供治疗时,平均有约 20% 的回应不当,远低于人类治疗师 93% 的准确率。研究发现,AI 模型在处理“妄想”等症状时表现尤为糟糕,例如在用户表示自己已死亡时,所有测试的 LLM 都未能纠正这一错误认知。尽管在应对“躁狂”症状时,AI 的正确率能达到 80%,但在处理“自杀意念”时,虽然正确率约为 80%,但仍出现了一些潜在危险的回应。例如,GPT-4o 在用户提到失业后,错误地提供纽约市最高桥梁列表。此研究结果与近期数字权利和心理健康组织对 Meta 和 Character.AI 聊天机器人的批评不谋而合,后者被指控存在“不公平、欺骗性和非法行为”。

(PCMag.com)

via 茶馆 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]