梁文锋DeepSeek论文登上《自然》封面

本周三,梁文锋团队在《自然》杂志发表论文,介绍开源AI模型DeepSeek-R1采用的大规模推理模型训练方法。研究表明,通过纯强化学习训练大规模推理模型,可有效提升大语言模型推理能力并降低人类输入需求。这款模型在数学、编程竞赛及STEM领域研究生水平任务中表现优异,如数学基准测试得分达 77.9% (DeepSeek-R1-Zero) 和79.8% ( DeepSeek-R1) 。模型以解决问题获奖励机制强化学习,减少训练成本与复杂性。梁文锋团队总结说,未来研究可以聚焦优化奖励过程,以确保推理和任务结果更可靠。

—— 科技日报

via 风向旗参考快讯 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]