🤖 OpenAI GPT-5:更少谄媚,但对不当内容容忍度更高

OpenAI最新旗舰模型GPT-5被首席执行官Sam Altman誉为“合法的博士级专家”。然而,内部测试显示其在处理不当内容方面存在“倒退”,同时在减少谄媚和幻觉方面有所改进。

* 内容容忍度问题:
* GPT-5对非暴力仇恨、威胁性骚扰、非法性内容、涉及未成年人的性内容、极端主义和威胁性仇恨等“低严重性”不当请求的容忍度更高。
* 其中,对威胁性仇恨内容和非法性内容的容忍度增加具有统计学意义,OpenAI承认这是“倒退”。
* GPT-5-thinking版本在欺骗、作弊或攻击问题方面的倾向有所降低,但仍不完美。

* 积极改进:
* 谄媚行为减少: 免费版ChatGPT的谄媚程度下降了69%,付费版下降了75%
* 幻觉率降低: 主要GPT-5模型包含至少一个“重大事实错误”的回复减少了44%;结合轻微和重大事实错误,整体改进率为26%
* GPT-5-thinking版本在幻觉方面表现最佳,错误回复最少,每条回复的正确声明最多。

(PCMag.com)

via 茶馆 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]