通义千问更新Qwen3-4B模型 手机也能跑
通义千问今日开源 Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507小模型。官方表示,新模型性能有了大幅提升。在非推理领域,前者全面超越了闭源的GPT4.1-Nano模型;而在推理领域,后者甚至可以媲美中等规模的Qwen3-30B-A3B(thinking)。通义千问在公告中称,SLM对 Agentic AI 的发展极具价值,“2507”版本的 Qwen3-4B 模型,体积小,性能强,对手机等端侧硬件部署尤为友好。这款新模型覆盖了更多语言的长尾知识,在主观和开放性任务中增强了人类偏好对齐,可提供更符合人们需求的答复。上下文理解扩至256K,小模型也能处理长文本。
—— 通义千问
via 风向旗参考快讯 - Telegram Channel
通义千问今日开源 Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507小模型。官方表示,新模型性能有了大幅提升。在非推理领域,前者全面超越了闭源的GPT4.1-Nano模型;而在推理领域,后者甚至可以媲美中等规模的Qwen3-30B-A3B(thinking)。通义千问在公告中称,SLM对 Agentic AI 的发展极具价值,“2507”版本的 Qwen3-4B 模型,体积小,性能强,对手机等端侧硬件部署尤为友好。这款新模型覆盖了更多语言的长尾知识,在主观和开放性任务中增强了人类偏好对齐,可提供更符合人们需求的答复。上下文理解扩至256K,小模型也能处理长文本。
—— 通义千问
via 风向旗参考快讯 - Telegram Channel