🤖 AI“胡说八道”根源揭示:评测标准缺陷与行业两难

一篇最新研究指出,人工智能(AI)聊天机器人如ChatGPT“胡说八道”并非技术故障,而是源于系统性的训练缺陷和当前主流评测标准的致命问题。这些标准将“猜对得1分,沉默或猜错得0分”,导致AI学会“宁可胡说,不可不说”。研究人员通过数学证明,AI的“胡说八道率”至少是其“判断错误率”的两倍。然而,修复此问题面临巨大行业阻力:目前仅有5%的用户愿意为ChatGPT付费,若AI过于诚实承认无知,用户恐转向“更自信”的竞争对手,威胁到AI公司的用户留存和生存。研究者呼吁改革评测标准,让AI学会说“我不知道”,但行业在AI的实用价值与真实智能之间陷入两难。

(IT业界资讯)

via 茶馆 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]