通义千问Qwen3-30B-A3B模型推出新版本
通义千问宣布 Qwen3-30B-A3B 模型推出新版本:Qwen3-30B-A3B-Instruct-2507 。据介绍,这是个非思考模式的新模型,长文本理解能力提升至 256K,仅激活 3B参数,就能取得可媲美 Gemini 2.5-Flash、GPT-4o等闭源模型的性能。该模型在诸多方面实现了关键提升:通用能力大幅提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多方面;在多语言的长尾知识覆盖方面,模型进步显著;在主观和开放任务中,新模型与进一步紧密对齐了用户偏好,可以生成更高质量的文本,为用户提供更有帮助的回答。目前,该模型已在魔搭社区和HuggingFace平台全面开源。
—— 通义千问
via 风向旗参考快讯 - Telegram Channel
通义千问宣布 Qwen3-30B-A3B 模型推出新版本:Qwen3-30B-A3B-Instruct-2507 。据介绍,这是个非思考模式的新模型,长文本理解能力提升至 256K,仅激活 3B参数,就能取得可媲美 Gemini 2.5-Flash、GPT-4o等闭源模型的性能。该模型在诸多方面实现了关键提升:通用能力大幅提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多方面;在多语言的长尾知识覆盖方面,模型进步显著;在主观和开放任务中,新模型与进一步紧密对齐了用户偏好,可以生成更高质量的文本,为用户提供更有帮助的回答。目前,该模型已在魔搭社区和HuggingFace平台全面开源。
—— 通义千问
via 风向旗参考快讯 - Telegram Channel