🚀OpenAI发布强大推理模型o3，性能大幅提升OpenAI发布了新型人工智能推理模型o3和o3-mini，其性能显著优于前代模型

🚀OpenAI发布强大推理模型o3，性能大幅提升

OpenAI发布了新型人工智能推理模型o3和o3-mini，其性能显著优于前代模型。在SWE-Bench Verified编码测试中，o3的性能提升了22.8%，甚至在编程竞赛中超越了OpenAI的首席科学家。在2024年AIME数学竞赛中，o3几乎取得了满分（仅错一题），并在专家级科学基准测试GPQA Diamond中取得了87.7%的成绩。更令人瞩目的是，o3解决了25.2%的最难数学和推理问题，远超其他模型（低于2%）的水平。虽然o3目前尚未公开发布，但OpenAI正在接受研究申请，以获取早期访问权限。OpenAI还强调了在“审慎对齐”方面的进展，通过逐步推理安全策略来提高AI安全性。

(The Verge)

via 茶馆 - Telegram Channel