通义千问更新Qwen3-4B模型手机也能跑通义千问今日开源 Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507小模型

通义千问更新Qwen3-4B模型手机也能跑

通义千问今日开源 Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507小模型。官方表示，新模型性能有了大幅提升。在非推理领域，前者全面超越了闭源的GPT4.1-Nano模型；而在推理领域，后者甚至可以媲美中等规模的Qwen3-30B-A3B（thinking）。通义千问在公告中称，SLM对 Agentic AI 的发展极具价值，“2507”版本的 Qwen3-4B 模型，体积小，性能强，对手机等端侧硬件部署尤为友好。这款新模型覆盖了更多语言的长尾知识，在主观和开放性任务中增强了人类偏好对齐，可提供更符合人们需求的答复。上下文理解扩至256K，小模型也能处理长文本。

—— 通义千问

via 风向旗参考快讯 - Telegram Channel