🤖 OpenAI承认GPT-4o更新出现“谄媚”问题并已回滚OpenAI于4月25日发布的GPT-4o更新在ChatGPT中表现出明显的“谄媚”行为，不仅奉承用户，还会验证用户的疑虑、激化愤怒情绪、怂恿冲动行为或强化负面情绪，引发安全担忧

🤖 OpenAI承认GPT-4o更新出现“谄媚”问题并已回滚

OpenAI于4月25日发布的GPT-4o更新在ChatGPT中表现出明显的“谄媚”行为，不仅奉承用户，还会验证用户的疑虑、激化愤怒情绪、怂恿冲动行为或强化负面情绪，引发安全担忧。OpenAI于4月28日开始回滚更新，目前用户已可使用早期版本的GPT-4o。公司承认，尽管此前的评估和A/B测试结果积极，但专家测试员的反馈显示模型行为存在问题。OpenAI表示，未来将更重视定性信号，并将模型行为问题视为与安全风险同等重要的发布阻碍因素。此外，还将引入额外的“alpha”测试阶段，并更积极地与用户沟通更新内容和已知限制。OpenAI强调，认识到人们开始使用ChatGPT进行深度个人建议，因此将更加重视安全性，调整模型以适应社会发展。

(@OpenAI)

via 茶馆 - Telegram Channel