OpenAI 12/12 日活动刚刚发布了:
- o3 模型的评估报告
- 宣称代码能力提升 20%
- 宣称超越前代的数学和推理能力
- 宣称在 ARC-AGI 中超越人类
- o3-mini 模型的评估报告
- o3-mini API 提供高中低三档的推理强度
- o3-mini 中强度的推理宣称在代码能力上超越 o1 完整版
- o3-mini 高强度的推理宣称在多项测试中提供与 o1 完整版近似的性能
o3-mini 将在明年一月底推出,随后「很快」推出 o3。
现在可以申请访问 o3-mini 进行安全测试(需要机构邮箱):https://openai.com/index/early-access-for-safety-testing/#how-to-apply
Openai
Early access for safety testing
We're offering safety and security researchers early access to our next frontier models.
via AI Copilot - Telegram Channel