前Qwen 核心技术骨干发声：大模型正进化为“行动派”原阿里通义千问（Qwen）大模型技术负责人林俊旸在离职数周后，于 3 月 26 日晚间首次公开发文，深度剖析了大模型技术的下一站演进

前Qwen 核心技术骨干发声：大模型正进化为“行动派”

原阿里通义千问（Qwen）大模型技术负责人林俊旸在离职数周后，于 3 月 26 日晚间首次公开发文，深度剖析了大模型技术的下一站演进。

林俊旸指出，行业正经历从“推理式思维”向“智能体思维（Agentic Thinking）”的跨越。他认为，过去一年行业纠结于如何让模型“多想一会儿”，而未来的核心将在于模型能否为了“采取行动”而思考，并在与现实世界的交互中持续修正计划。

反思千问研发之路：强行合并“思考”与“指令”的阵痛

林俊旸在文中坦诚分享了千问团队在 2025 年初的尝试与教训。当时团队曾雄心勃勃地试图构建一个统一系统，让模型能根据问题难度自动调节推理力度。

然而实践证明，推理数据与指令数据在分布上的显著差异，导致强行合并后的模型在两个方向上都表现平庸：思考时显得冗余果断不足，执行指令时又不够可靠且成本高昂。这一洞察解释了为何 Qwen 随后转向了独立发布 Instruct 和 Thinking 版本的路线，也为行业提供了宝贵的工程参考。

定义“好思考”的新标准：能撑起有效行动才是关键

在林俊旸看来，推理链的长度并不直接等同于模型的聪明程度，盲目追求长逻辑链往往是在浪费算力。他预判，未来的研发重心将从单纯的训练模型，转向训练“模型+环境”的整个智能体系统。

在这种新范式下，评估模型好坏的标准将从“能否解出复杂的数学证明”转变为“能否在真实约束下通过持续交互取得进展”。这意味着，环境设计、多智能体协同以及评估器的稳健性，将正式进入 AI 研发的核心圈。

via AI新闻资讯 (author: AI Base)