🚀OpenAI发布强大推理模型o3,性能大幅提升

OpenAI发布了新型人工智能推理模型o3和o3-mini,其性能显著优于前代模型。在SWE-Bench Verified编码测试中,o3的性能提升了22.8%,甚至在编程竞赛中超越了OpenAI的首席科学家。在2024年AIME数学竞赛中,o3几乎取得了满分(仅错一题),并在专家级科学基准测试GPQA Diamond中取得了87.7%的成绩。更令人瞩目的是,o3解决了25.2%的最难数学和推理问题,远超其他模型(低于2%)的水平。虽然o3目前尚未公开发布,但OpenAI正在接受研究申请,以获取早期访问权限。OpenAI还强调了在“审慎对齐”方面的进展,通过逐步推理安全策略来提高AI安全性。

(The Verge)

via 茶馆 - Telegram Channel
 
 
Back to Top