Google 发布 Gemini 3.1 Flash-Lite,定价每百万输入 Token 0.25 美元Google 于 3 月 3 日推出 Gemini 3.1 Flash-Lite,定位为 Gemini 3 系列中速度最快、成本最低的模型,面向高并发开发者工作负载设计

Google 发布 Gemini 3.1 Flash-Lite,定价每百万输入 Token 0.25 美元

Google 于 3 月 3 日推出 Gemini 3.1 Flash-Lite,定位为 Gemini 3 系列中速度最快、成本最低的模型,面向高并发开发者工作负载设计。该模型定价为每百万输入 Token 0.25 美元、每百万输出 Token 1.50 美元,现已通过 Google AI Studio 的 Gemini API 及 Vertex AI 向开发者和企业开放预览。

据 Artificial Analysis 基准测试,3.1 Flash-Lite 首 Token 响应速度较 2.5 Flash 提升 2.5 倍,输出速度提升 45%；在 Arena.ai 排行榜上 Elo 得分为 1432,GPQA Diamond 得分 86.9%,MMMU Pro 得分 76.8%,超越此前多个更大规模的 Gemini 旧版模型。该模型标配可调节的"思考层级"功能,开发者可按任务复杂度灵活控制推理深度。

Google

🍀在花频道 🍵茶馆聊天 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel