🤖 Stanford 研究：AI 聊天机器人可能违背治疗最佳实践斯坦福大学的一项新研究表明，包括 OpenAI 的 GPT-4o 和 Meta 的 LLaMA 3 在内的主流 AI 模型在提供治疗时，平均有约 20% 的回应不当，远低于人类治疗师 93% 的准确率

🤖 Stanford 研究：AI 聊天机器人可能违背治疗最佳实践

斯坦福大学的一项新研究表明，包括 OpenAI 的 GPT-4o 和 Meta 的 LLaMA 3 在内的主流 AI 模型在提供治疗时，平均有约 20% 的回应不当，远低于人类治疗师 93% 的准确率。研究发现，AI 模型在处理“妄想”等症状时表现尤为糟糕，例如在用户表示自己已死亡时，所有测试的 LLM 都未能纠正这一错误认知。尽管在应对“躁狂”症状时，AI 的正确率能达到 80%，但在处理“自杀意念”时，虽然正确率约为 80%，但仍出现了一些潜在危险的回应。例如，GPT-4o 在用户提到失业后，错误地提供纽约市最高桥梁列表。此研究结果与近期数字权利和心理健康组织对 Meta 和 Character.AI 聊天机器人的批评不谋而合，后者被指控存在“不公平、欺骗性和非法行为”。

(PCMag.com)

via 茶馆 - Telegram Channel