阿里巴巴宣布推出 Qwen3 大型语言模型
今天,阿里通义千问宣布推出Qwen3,这是 Qwen 系列大型语言模型的最新成员。阿里通义千问的旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与顶级模型相比,表现出极具竞争力的结果。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。阿里通义千问在 Apache 2.0 许可下开源了两个 MoE 模型的权重:Qwen3-235B-A22B,一个拥有2350多亿总参数和 220多亿激活参数的大模型,以及Qwen3-30B-A3B,一个拥有约300亿总参数和30亿激活参数的小型 MoE 模型。
—— 阿里通义千问
via 风向旗参考快讯 - Telegram Channel
今天,阿里通义千问宣布推出Qwen3,这是 Qwen 系列大型语言模型的最新成员。阿里通义千问的旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与顶级模型相比,表现出极具竞争力的结果。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。阿里通义千问在 Apache 2.0 许可下开源了两个 MoE 模型的权重:Qwen3-235B-A22B,一个拥有2350多亿总参数和 220多亿激活参数的大模型,以及Qwen3-30B-A3B,一个拥有约300亿总参数和30亿激活参数的小型 MoE 模型。
—— 阿里通义千问
via 风向旗参考快讯 - Telegram Channel