北京时间4月3日凌晨,谷歌正式发布开源大模型 Gemma4,凭借“单位参数智能”的突破性提升,定义了开源模型辅助智能体工作流的新标准。
该系列包含高效版 E2B(2.3B)、E4B(4.5B)以及高性能版26B MoE 与31B 稠密模型。作为基于 Gemini3技术栈构建的最新成果,Gemma4全系支持多模态输入(图片与视频),其中 E2B 与 E4B 更是原生支持语音输入,实现了端侧实时的语音理解。
技术架构上,大参数模型通过优化实现了极高的硬件效率,31B 稠密版在 Arena AI 文本榜单中位列开源模型全球第三,26B MoE 版位居第六,其逻辑推理与函数调用能力足以驱动复杂的自主智能体。
在本地部署方面,Gemma4显著降低了前沿 AI 能力的准入门槛。31B 模型的非量化权重可运行于单块80GB H100显卡,量化版则兼容消费级显卡。针对移动端与 IoT 设备,E2B 和 E4B 模型通过创新的 PLE 嵌入技术与128K 长上下文支持,在 Raspberry Pi 及智能手机上实现了低延迟的逻辑处理。
此次发布不仅展示了谷歌在开源生态的深厚积淀,更通过 Apache2.0协议的开放姿态,为全球开发者提供了构建本地化、高隐私性 AI 应用的底座。
via AI新闻资讯 (author: AI Base)