🤝 OpenAI 收集全球用户反馈，更新AI模型行为规范OpenAI 近日公布了其“集体对齐”研究的初步进展，旨在将全球用户的多样化价值观和优先事项融入其AI模型行为规范（Model Spec）

🤝 OpenAI 收集全球用户反馈，更新AI模型行为规范

OpenAI 近日公布了其“集体对齐”研究的初步进展，旨在将全球用户的多样化价值观和优先事项融入其AI模型行为规范（Model Spec）。该项目收集了来自全球 19个国家（参与者原籍地超过50个）的 1000多名 用户的反馈。参与者通过评估合成提示和响应示例，并对四种可能的完成方式进行排名，表达了他们的偏好。

研究发现，许多参与者的偏好与现有规范一致，但分歧也促成了对规范的澄清或新的更新提案。OpenAI 采用了部分修改，并将很快在下一版Model Spec中发布。然而，有两项主要提案未被采纳：一是定制化政治内容生成，因担心大规模个性化政治目标定位的风险；二是面向成年人的情色内容，尽管与OpenAI的既定立场一致，但仍需更多研究和产品工作以确保正确部署。

OpenAI 已将此次收集的公共输入数据集分享到 HuggingFace，以促进AI研究生态系统的进一步工作。公司承认当前研究的局限性，包括样本量相对较小和自动化流程的合法性问题，并计划在未来扩大规模并改进对齐流程，探索定义多个默认行为集以反映不同价值观。

(@OpenAI)

via 茶馆 - Telegram Channel