前Qwen 核心技术骨干发声:大模型正进化为“行动派”
原阿里通义千问(Qwen)大模型技术负责人林俊旸在离职数周后,于 3 月 26 日晚间首次公开发文,深度剖析了大模型技术的下一站演进。
林俊旸指出,行业正经历从“推理式思维”向“智能体思维(Agentic Thinking)”的跨越。他认为,过去一年行业纠结于如何让模型“多想一会儿”,而未来的核心将在于模型能否为了“采取行动”而思考,并在与现实世界的交互中持续修正计划。
反思千问研发之路:强行合并“思考”与“指令”的阵痛
林俊旸在文中坦诚分享了千问团队在 2025 年初的尝试与教训。当时团队曾雄心勃勃地试图构建一个统一系统,让模型能根据问题难度自动调节推理力度。
然而实践证明,推理数据与指令数据在分布上的显著差异,导致强行合并后的模型在两个方向上都表现平庸:思考时显得冗余果断不足,执行指令时又不够可靠且成本高昂。这一洞察解释了为何 Qwen 随后转向了独立发布 Instruct 和 Thinking 版本的路线,也为行业提供了宝贵的工程参考。
定义“好思考”的新标准:能撑起有效行动才是关键
在林俊旸看来,推理链的长度并不直接等同于模型的聪明程度,盲目追求长逻辑链往往是在浪费算力。他预判,未来的研发重心将从单纯的训练模型,转向训练“模型+环境”的整个智能体系统。
在这种新范式下,评估模型好坏的标准将从“能否解出复杂的数学证明”转变为“能否在真实约束下通过持续交互取得进展”。这意味着,环境设计、多智能体协同以及评估器的稳健性,将正式进入 AI 研发的核心圈。
via AI新闻资讯 (author: AI Base)
原阿里通义千问(Qwen)大模型技术负责人林俊旸在离职数周后,于 3 月 26 日晚间首次公开发文,深度剖析了大模型技术的下一站演进。
林俊旸指出,行业正经历从“推理式思维”向“智能体思维(Agentic Thinking)”的跨越。他认为,过去一年行业纠结于如何让模型“多想一会儿”,而未来的核心将在于模型能否为了“采取行动”而思考,并在与现实世界的交互中持续修正计划。
反思千问研发之路:强行合并“思考”与“指令”的阵痛
林俊旸在文中坦诚分享了千问团队在 2025 年初的尝试与教训。当时团队曾雄心勃勃地试图构建一个统一系统,让模型能根据问题难度自动调节推理力度。
然而实践证明,推理数据与指令数据在分布上的显著差异,导致强行合并后的模型在两个方向上都表现平庸:思考时显得冗余果断不足,执行指令时又不够可靠且成本高昂。这一洞察解释了为何 Qwen 随后转向了独立发布 Instruct 和 Thinking 版本的路线,也为行业提供了宝贵的工程参考。
定义“好思考”的新标准:能撑起有效行动才是关键
在林俊旸看来,推理链的长度并不直接等同于模型的聪明程度,盲目追求长逻辑链往往是在浪费算力。他预判,未来的研发重心将从单纯的训练模型,转向训练“模型+环境”的整个智能体系统。
在这种新范式下,评估模型好坏的标准将从“能否解出复杂的数学证明”转变为“能否在真实约束下通过持续交互取得进展”。这意味着,环境设计、多智能体协同以及评估器的稳健性,将正式进入 AI 研发的核心圈。
via AI新闻资讯 (author: AI Base)