阿里巴巴正式发布千问系列旗舰推理模型——Qwen3-Max-Thinking。该模型在复杂推理、事实知识及智能体能力等核心维度实现跨越式升级,号称总参数量已突破万亿大关。在多项权威基准测试中,其综合表现已能与 GPT-5.2-Thinking、Claude-Opus-4.5及 Gemini3Pro 等全球顶尖模型并驾齐驱。
Qwen3-Max-Thinking 采用了更为大规模的强化学习训练,并引入了“自适应工具调用”和“测试时扩展”两项核心创新技术。它不仅能像人类专家一样在思考的同时自主调用搜索、记忆和代码解释器,还显著降低了模型幻觉,使其在处理真实世界的复杂任务时更加智能、流畅。
目前,Qwen3-Max-Thinking 已正式上线 Qwen Chat 供用户交互体验,其 API(模型名称:qwen3-max-2026-01-23)也已同步向开发者开放。
划重点:
● 🚀 性能对标国际顶流:在19项权威测试中,Qwen3-Max-Thinking 的性能媲美 GPT-5.2和 Claude-4.5,处于国际领先水平。
● 🤖 原生智能体能力:模型具备自适应工具调用能力,可根据任务需求自主选择搜索引擎或代码解释器,实现“边用边思”。
● 🧠 万亿级参数推理:通过更大规模的强化学习与测试时扩展(Test-Time Scaling)技术,大幅提升了在科学知识与数学推理等高难度领域的表现。
via AI新闻资讯 (author: AI Base)