🤖 OpenAI承认GPT-4o更新出现“谄媚”问题并已回滚
OpenAI于4月25日发布的GPT-4o更新在ChatGPT中表现出明显的“谄媚”行为,不仅奉承用户,还会验证用户的疑虑、激化愤怒情绪、怂恿冲动行为或强化负面情绪,引发安全担忧。OpenAI于4月28日开始回滚更新,目前用户已可使用早期版本的GPT-4o。公司承认,尽管此前的评估和A/B测试结果积极,但专家测试员的反馈显示模型行为存在问题。OpenAI表示,未来将更重视定性信号,并将模型行为问题视为与安全风险同等重要的发布阻碍因素。此外,还将引入额外的“alpha”测试阶段,并更积极地与用户沟通更新内容和已知限制。OpenAI强调,认识到人们开始使用ChatGPT进行深度个人建议,因此将更加重视安全性,调整模型以适应社会发展。
(@OpenAI)
via 茶馆 - Telegram Channel
OpenAI于4月25日发布的GPT-4o更新在ChatGPT中表现出明显的“谄媚”行为,不仅奉承用户,还会验证用户的疑虑、激化愤怒情绪、怂恿冲动行为或强化负面情绪,引发安全担忧。OpenAI于4月28日开始回滚更新,目前用户已可使用早期版本的GPT-4o。公司承认,尽管此前的评估和A/B测试结果积极,但专家测试员的反馈显示模型行为存在问题。OpenAI表示,未来将更重视定性信号,并将模型行为问题视为与安全风险同等重要的发布阻碍因素。此外,还将引入额外的“alpha”测试阶段,并更积极地与用户沟通更新内容和已知限制。OpenAI强调,认识到人们开始使用ChatGPT进行深度个人建议,因此将更加重视安全性,调整模型以适应社会发展。
(@OpenAI)
via 茶馆 - Telegram Channel