🤝 OpenAI 收集全球用户反馈,更新AI模型行为规范

OpenAI 近日公布了其“集体对齐”研究的初步进展,旨在将全球用户的多样化价值观和优先事项融入其AI模型行为规范(Model Spec)。该项目收集了来自全球 19个国家(参与者原籍地超过50个)的 1000多名 用户的反馈。参与者通过评估合成提示和响应示例,并对四种可能的完成方式进行排名,表达了他们的偏好。

研究发现,许多参与者的偏好与现有规范一致,但分歧也促成了对规范的澄清或新的更新提案。OpenAI 采用了部分修改,并将很快在下一版Model Spec中发布。然而,有两项主要提案未被采纳:一是定制化政治内容生成,因担心大规模个性化政治目标定位的风险;二是面向成年人的情色内容,尽管与OpenAI的既定立场一致,但仍需更多研究和产品工作以确保正确部署。

OpenAI 已将此次收集的公共输入数据集分享到 HuggingFace,以促进AI研究生态系统的进一步工作。公司承认当前研究的局限性,包括样本量相对较小和自动化流程的合法性问题,并计划在未来扩大规模并改进对齐流程,探索定义多个默认行为集以反映不同价值观。

(@OpenAI)

via 茶馆 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]