🤖 DeepSeek-R1模型实现AI推理能力重大突破,数学竞赛成绩超越人类平均水平

中国AI公司DeepSeek发布的DeepSeek-R1模型在《自然》杂志上展示了其通过纯强化学习训练,无需人工标注,自主发展出高级推理模式的能力,包括自我反思和动态策略调整。该模型在美国数学邀请赛(AIME)2024测试中表现卓越,准确率从初始的15.6%跃升至77.9%,使用自一致性解码后更达到86.7%,大幅超越了人类参赛者的平均水平。DeepSeek-R1在训练中还出现了“顿悟时刻”,并保持了强大的通用语言生成能力,同时在编程竞赛和STEM领域问题上表现出色。

(科技圈)

via 茶馆 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]