国产推理模型新标杆！阿里发布万亿参数 Qwen3-Max-Thinking，性能直指 GPT-5.2阿里巴巴正式发布千问系列旗舰推理模型——Qwen3-Max-Thinking

国产推理模型新标杆！阿里发布万亿参数 Qwen3-Max-Thinking，性能直指 GPT-5.2

阿里巴巴正式发布千问系列旗舰推理模型——Qwen3-Max-Thinking。该模型在复杂推理、事实知识及智能体能力等核心维度实现跨越式升级，号称总参数量已突破万亿大关。在多项权威基准测试中，其综合表现已能与 GPT-5.2-Thinking、Claude-Opus-4.5及 Gemini3Pro 等全球顶尖模型并驾齐驱。

Qwen3-Max-Thinking 采用了更为大规模的强化学习训练，并引入了“自适应工具调用”和“测试时扩展”两项核心创新技术。它不仅能像人类专家一样在思考的同时自主调用搜索、记忆和代码解释器，还显著降低了模型幻觉，使其在处理真实世界的复杂任务时更加智能、流畅。

目前，Qwen3-Max-Thinking 已正式上线 Qwen Chat 供用户交互体验，其 API（模型名称:qwen3-max-2026-01-23）也已同步向开发者开放。

划重点:

● 🚀 性能对标国际顶流:在19项权威测试中，Qwen3-Max-Thinking 的性能媲美 GPT-5.2和 Claude-4.5，处于国际领先水平。
● 🤖 原生智能体能力:模型具备自适应工具调用能力，可根据任务需求自主选择搜索引擎或代码解释器，实现“边用边思”。
● 🧠 万亿级参数推理:通过更大规模的强化学习与测试时扩展（Test-Time Scaling）技术，大幅提升了在科学知识与数学推理等高难度领域的表现。

via AI新闻资讯 (author: AI Base)