🚀 阿里 Qwen 3.5 提交代码申请,多款开源模型发布在即
Hugging Face 页面显示,阿里通义千问新一代基座模型 Qwen 3.5 已提交并入 Transformers 的代码申请,预示该模型发布在即。Qwen 3.5 采用全新的混合注意力机制,具备原生视觉理解能力。开发者透露,阿里或将开源至少 2B 规模的密集模型及 35B-A3B 规模的 MoE 模型。此前有消息称,包括 Qwen 3.5 与 DeepSeek v4 在内的多款大模型均计划于近期集中发布。
(科技圈)
via 茶馆 - Telegram Channel
Hugging Face 页面显示,阿里通义千问新一代基座模型 Qwen 3.5 已提交并入 Transformers 的代码申请,预示该模型发布在即。Qwen 3.5 采用全新的混合注意力机制,具备原生视觉理解能力。开发者透露,阿里或将开源至少 2B 规模的密集模型及 35B-A3B 规模的 MoE 模型。此前有消息称,包括 Qwen 3.5 与 DeepSeek v4 在内的多款大模型均计划于近期集中发布。
(科技圈)
via 茶馆 - Telegram Channel