🤖 Google 发布 Gemini 2.5 Computer Use 模型：AI 可像人类般操作浏览器Google 近日推出了 Gemini 2.5 Computer Use 模型，该 AI 模型基于 Gemini 2.5 Pro 的视觉理解和推理能力，旨在像人类一样在浏览器中导航和交互

🤖 Google 发布 Gemini 2.5 Computer Use 模型：AI 可像人类般操作浏览器

Google 近日推出了 Gemini 2.5 Computer Use 模型，该 AI 模型基于 Gemini 2.5 Pro 的视觉理解和推理能力，旨在像人类一样在浏览器中导航和交互。它能够分析用户请求并执行任务，包括填写和提交表单、点击、滚动和输入文本等操作。该模型在多个网络和移动控制基准测试中表现优异，并具有更低的延迟。Google 表示，该模型主要针对网络浏览器进行了优化，目前支持 13 种操作，但尚未针对桌面操作系统级别的控制进行优化。开发者可通过 Google AI Studio 和 Vertex AI 访问此模型，Browserbase 也提供了演示环境。

(科技圈)

via 茶馆 - Telegram Channel