🚀 谷歌推出 Gemini 2.5 Flash 预览版:推理能力大幅提升,成本效益更优

谷歌发布 Gemini 2.5 Flash 的早期预览版本,通过 Google AI Studio 和 Vertex AI 上的 Gemini API 提供。新模型在 2.0 Flash 的基础上,显著提升了推理能力,同时保持了速度和成本优势。Gemini 2.5 Flash 采用混合推理模型,允许开发者开启或关闭“思考”过程,并设置“思考预算”以平衡质量、成本和延迟。即使关闭“思考”,也能保持 2.0 Flash 的速度并提升性能。在 LMArena 的 Hard Prompts 测试中,Gemini 2.5 Flash 的表现仅次于 2.5 Pro。该模型还具有精细的控制功能,开发者可以通过设置 0 到 24576 个 tokens 的“思考预算”来管理推理质量。

(HackerNews)

via 茶馆 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]