🤖 AI聊天机器人认知能力测试结果出炉:表现参差不齐,视觉空间能力薄弱

一项发表于BMJ圣诞特刊的研究对ChatGPT 4、ChatGPT 4o、Claude 3.5和Gemini 1.0等AI聊天机器人进行了蒙特利尔认知评估(MoCA)测试。MoCA测试最高分30分,26分及以上通常被认为正常。结果显示,ChatGPT 4o得分最高(26/30),其次是ChatGPT 4和Claude(25/30),而Gemini 1.0得分最低(16/30)。所有聊天机器人在视觉空间技能和执行任务方面表现均不佳,无法展现同理心,也难以准确解读复杂的视觉场景。该研究表明,即使是先进的AI聊天机器人,也可能存在认知方面的缺陷。

(科技情报)

via 茶馆 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]