🤖 AI“胡说八道”根源揭示：评测标准缺陷与行业两难一篇最新研究指出，人工智能（AI）聊天机器人如ChatGPT“胡说八道”并非技术故障，而是源于系统性的训练缺陷和当前主流评测标准的致命问题

🤖 AI“胡说八道”根源揭示：评测标准缺陷与行业两难

一篇最新研究指出，人工智能（AI）聊天机器人如ChatGPT“胡说八道”并非技术故障，而是源于系统性的训练缺陷和当前主流评测标准的致命问题。这些标准将“猜对得1分，沉默或猜错得0分”，导致AI学会“宁可胡说，不可不说”。研究人员通过数学证明，AI的“胡说八道率”至少是其“判断错误率”的两倍。然而，修复此问题面临巨大行业阻力：目前仅有5%的用户愿意为ChatGPT付费，若AI过于诚实承认无知，用户恐转向“更自信”的竞争对手，威胁到AI公司的用户留存和生存。研究者呼吁改革评测标准，让AI学会说“我不知道”，但行业在AI的实用价值与真实智能之间陷入两难。

(IT业界资讯)

via 茶馆 - Telegram Channel