📊 1st Proof项目发布10道研究级数学题评估AI自主科研能力来自斯坦福、耶鲁、哈佛及哥伦比亚大学等机构的研究团队发布了名为“1st Proof”的初步研究项目，旨在通过10道研究级数学题评估人工智能自主解决科研问题的能力

📊 1st Proof项目发布10道研究级数学题评估AI自主科研能力

来自斯坦福、耶鲁、哈佛及哥伦比亚大学等机构的研究团队发布了名为“1st Proof”的初步研究项目，旨在通过10道研究级数学题评估人工智能自主解决科研问题的能力。这些题目涵盖代数组合、谱图论、代数拓扑、随机分析、辛几何、表示论、李群格点、张量分析及数值线性代数等领域，均源于作者的实际研究过程。目前，这些题目的证明过程（通常在5页以内）尚未在互联网公开。

该项目要求AI模型在不依赖人类提供数学思路或核心提示的情况下，自主生成符合学术严谨性要求的证明，并提供包含精确条款编号的同行评审期刊或arXiv预印本引用。加密后的标准答案定于太平洋时间2026年2月13日23时59分公布。研究团队包括Martin Hairer、Daniel Spielman和Nikhil Srivastava等学者，他们计划通过此次社区实验，为未来开发更结构化的AI科研能力评估基准奠定基础。

(@OpenAI)

via 茶馆 - Telegram Channel