🤖 AI聊天机器人认知能力测试结果出炉：表现参差不齐，视觉空间能力薄弱一项发表于BMJ圣诞特刊的研究对ChatGPT 4、ChatGPT 4o、Claude 3.5和Gemini 1.0等AI聊天机器人进行了蒙特利尔认知评估（MoCA）测试

🤖 AI聊天机器人认知能力测试结果出炉：表现参差不齐，视觉空间能力薄弱

一项发表于BMJ圣诞特刊的研究对ChatGPT 4、ChatGPT 4o、Claude 3.5和Gemini 1.0等AI聊天机器人进行了蒙特利尔认知评估（MoCA）测试。MoCA测试最高分30分，26分及以上通常被认为正常。结果显示，ChatGPT 4o得分最高（26/30），其次是ChatGPT 4和Claude（25/30），而Gemini 1.0得分最低（16/30）。所有聊天机器人在视觉空间技能和执行任务方面表现均不佳，无法展现同理心，也难以准确解读复杂的视觉场景。该研究表明，即使是先进的AI聊天机器人，也可能存在认知方面的缺陷。

(科技情报)

via 茶馆 - Telegram Channel