该模型具备更强的多模态能力,支持文本、图像、视频、音频输入及多模态输出,如原生图像生成和多语言文本转语音 (TTS)。速度相较 Gemini 1.5 Pro 提升至两倍,优化多模态推理、复杂指令遵循及工具使用。模型支持调用 Google 搜索、代码执行等功能,并在现实任务、网页交互和编码辅助等场景表现出色。实验版本 Gemini 2.0 Flash 已向开发者开放,预计 2025 年 1 月全面推广多模态功能,同时推出多模态实时 API,为开发者提供更多应用支持。
X | Google
📮投稿机器人 ☘️频道 🌸聊天
via 科技圈🎗在花频道📮 - Telegram Channel