📊 1st Proof项目发布10道研究级数学题评估AI自主科研能力

来自斯坦福、耶鲁、哈佛及哥伦比亚大学等机构的研究团队发布了名为“1st Proof”的初步研究项目,旨在通过10道研究级数学题评估人工智能自主解决科研问题的能力。这些题目涵盖代数组合、谱图论、代数拓扑、随机分析、辛几何、表示论、李群格点、张量分析及数值线性代数等领域,均源于作者的实际研究过程。目前,这些题目的证明过程(通常在5页以内)尚未在互联网公开。

该项目要求AI模型在不依赖人类提供数学思路或核心提示的情况下,自主生成符合学术严谨性要求的证明,并提供包含精确条款编号的同行评审期刊或arXiv预印本引用。加密后的标准答案定于太平洋时间2026年2月13日23时59分公布。研究团队包括Martin Hairer、Daniel Spielman和Nikhil Srivastava等学者,他们计划通过此次社区实验,为未来开发更结构化的AI科研能力评估基准奠定基础。

(@OpenAI)

via 茶馆 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]