OpenAI最新旗舰模型GPT-5被首席执行官Sam Altman誉为“合法的博士级专家”。然而,内部测试显示其在处理不当内容方面存在“倒退”,同时在减少谄媚和幻觉方面有所改进。
* 内容容忍度问题:
* GPT-5对非暴力仇恨、威胁性骚扰、非法性内容、涉及未成年人的性内容、极端主义和威胁性仇恨等“低严重性”不当请求的容忍度更高。
* 其中,对威胁性仇恨内容和非法性内容的容忍度增加具有统计学意义,OpenAI承认这是“倒退”。
* GPT-5-thinking版本在欺骗、作弊或攻击问题方面的倾向有所降低,但仍不完美。
* 积极改进:
* 谄媚行为减少: 免费版ChatGPT的谄媚程度下降了69%,付费版下降了75%。
* 幻觉率降低: 主要GPT-5模型包含至少一个“重大事实错误”的回复减少了44%;结合轻微和重大事实错误,整体改进率为26%。
* GPT-5-thinking版本在幻觉方面表现最佳,错误回复最少,每条回复的正确声明最多。
(PCMag.com)
via 茶馆 - Telegram Channel