谷歌推出 Gemma 3 QAT 模型 消费级显卡即可运行

上个月,谷歌公司发布了最新一代开放大模型Gemma 3,其卓越的性能能够利用原生的 BF16 精度在 NVIDIA H100 等单块高端加速卡上运行。为了进一步提升 Gemma 3 的易用性,谷歌宣布宣布推出采用量化感知训练 (QAT) 优化的新版本,该技术可在保持高质量的同时显著降低显存需求,可以在 NVIDIA RTX 3090 等消费级显卡上本地运行 Gemma 3 27B 等强大的模型。QAT 并非仅在模型完全训练完成后才进行量化,而是在训练过程中融入了量化过程,从而显著减少训练后的性能损失。Gemma 3 27B 模型的显存占用从 54 GB(BF16)降至仅 14.1 GB(int4),仍能保持高质量结果。

—— 谷歌博客

via 风向旗参考快讯 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]