AI能提出诺贝尔奖级别的创意吗?新研究给出了答案

当前,人工智能(AI)正在全球多个学科领域加速科研进程,尤其在自动化生成科学假说方面展现出显著能力。AI能够快速扫描海量文献、识别研究空白,并提出人类可能忽略的研究方向。然而,近期一项大规模研究表明,尽管AI能够快速提出大量设想,但其创新性和可行性在经过实验验证后普遍低于人类提出的假说。该研究论文已于近期发布于预印本平台arXiv。

这项研究聚焦自然语言处理(NLP)领域,使用美国AI初创公司Anthropic开发的大型语言模型Claude 3.5 Sonnet生成数千个假设,并邀请专业研究人员提出竞争性人类假设。初步盲评显示AI生成假设获得更高新颖性评分,但在实际实验阶段,24个AI假设与19个人类假设经过独立测试后,AI假设的新颖性得分显著下降,而人类假设得分相对稳定。

研究人员指出,AI常倾向于使用吸引人的术语包装已知概念,导致其假设表面光鲜但实质创新有限。此外,AI在判断实验可行性方面也存在明显不足。该研究也引发学界对科学创新评价标准的讨论。美国华盛顿大学学者指出,新颖性本身就是科学评估中的难点,人类评审也常存在主观差异。

尽管存在差距,AI与人类得分的接近程度已远超预期。美国艾伦人工智能研究所专家认为,若AI能基于更多高质量研究进行训练,其提出创新假设的能力有望提升。未来,AI可能承担更多假设生成工作,而科学家则专注于实验验证——这既提高了效率,也带来了科学探索本质变化的思考。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:网易科技)
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]