阿里通义千问 Qwen3 开源全新推理模型
阿里通义千问今日在公众号宣布推出全新推理模型 Qwen3-30B-A3B-Thinking-2507。相较于 4 月 29 日开源的 Qwen3-30-A3B 模型,新模型在推理能力、通用能力及上下文长度上有了显著提升:新模型在聚焦数学能力的 AIME25 评测中获85.0分,在代码能力测试LiveCodeBench v6中得分66.0,两项核心推理能力均超越 Gemini2.5-Flash(thinking)、Qwen3-235B-A22B (thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著;原生支持 256K tokens ,可扩展至 1M tokens 。新模型思考长度增加,团队建议在处理高度复杂的推理任务时,设置更长的思考预算,可以充分发挥新模型潜力。
—— 通义千问
via 风向旗参考快讯 - Telegram Channel
阿里通义千问今日在公众号宣布推出全新推理模型 Qwen3-30B-A3B-Thinking-2507。相较于 4 月 29 日开源的 Qwen3-30-A3B 模型,新模型在推理能力、通用能力及上下文长度上有了显著提升:新模型在聚焦数学能力的 AIME25 评测中获85.0分,在代码能力测试LiveCodeBench v6中得分66.0,两项核心推理能力均超越 Gemini2.5-Flash(thinking)、Qwen3-235B-A22B (thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著;原生支持 256K tokens ,可扩展至 1M tokens 。新模型思考长度增加,团队建议在处理高度复杂的推理任务时,设置更长的思考预算,可以充分发挥新模型潜力。
—— 通义千问
via 风向旗参考快讯 - Telegram Channel