谷歌发布新一代人工智能模型 Gemini 2.0该模型具备更强的多模态能力，支持文本、图像、视频、音频输入及多模态输出，如原生图像生成和多语言文本转语音 (TTS)

谷歌发布新一代人工智能模型 Gemini 2.0

该模型具备更强的多模态能力，支持文本、图像、视频、音频输入及多模态输出，如原生图像生成和多语言文本转语音 (TTS)。速度相较 Gemini 1.5 Pro 提升至两倍，优化多模态推理、复杂指令遵循及工具使用。模型支持调用 Google 搜索、代码执行等功能，并在现实任务、网页交互和编码辅助等场景表现出色。实验版本 Gemini 2.0 Flash 已向开发者开放，预计 2025 年 1 月全面推广多模态功能，同时推出多模态实时 API，为开发者提供更多应用支持。

X | Google

📮投稿机器人 ☘️频道 🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel