OpenAI 和 Google DeepMind 先后宣称他们的 AI 模型在国际数学奥林匹克竞赛中取得金牌成绩

2025-07-22 18:32 by 开普勒62号4:先行者

国际数学奥林匹克竞赛(IMO)是最负盛名的年轻数学家竞赛,自 1959 年以来每年举办一次。每个参赛国家派出六人参赛,他们需要完成六道代数、组合学、几何学和数论领域的高难度题目。完成六题中的五题就能获得金牌。过去几年 AI 公司也越来越多的用 IMO 比赛题目去检验其先进 AI 模型的数学解题和推理能力。去年 Google DeepMind 的 lphaProof 和 AlphaGeometry 2 完成了六题中的四题,得到 28 分(每题 7 分)获得银牌,但这些题目需要在人类专家的帮助下首先翻译成数学语言,且每题需要长达三天时间去解决而不是人类选手的 4.5 小时。OpenAI 研究员 Alexander Wei 上周六宣布该公司的一个实验模型拿到 IMO 比赛的金牌成绩。但此举违反了 IMO 主办方要求到 7 月 28 日再公布成绩的规定,在数学社区引发了争议,也促使 DeepMind 提前公布了该公司先进模型的成绩——解决了 6 题中的 5 题获得金牌,且不再需要翻译而是使用自然语言。

arstechnica.com/ai/2025/07/openai-jumps-gun-on-international-math-olympiad-gold-medal-announcement/
deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/

#人工智能

via Solidot - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]