🤖 Google 发布 Gemini 2.5 Computer Use 模型:AI 可像人类般操作浏览器
Google 近日推出了 Gemini 2.5 Computer Use 模型,该 AI 模型基于 Gemini 2.5 Pro 的视觉理解和推理能力,旨在像人类一样在浏览器中导航和交互。它能够分析用户请求并执行任务,包括填写和提交表单、点击、滚动和输入文本等操作。该模型在多个网络和移动控制基准测试中表现优异,并具有更低的延迟。Google 表示,该模型主要针对网络浏览器进行了优化,目前支持 13 种操作,但尚未针对桌面操作系统级别的控制进行优化。开发者可通过 Google AI Studio 和 Vertex AI 访问此模型,Browserbase 也提供了演示环境。
(科技圈)
via 茶馆 - Telegram Channel
Google 近日推出了 Gemini 2.5 Computer Use 模型,该 AI 模型基于 Gemini 2.5 Pro 的视觉理解和推理能力,旨在像人类一样在浏览器中导航和交互。它能够分析用户请求并执行任务,包括填写和提交表单、点击、滚动和输入文本等操作。该模型在多个网络和移动控制基准测试中表现优异,并具有更低的延迟。Google 表示,该模型主要针对网络浏览器进行了优化,目前支持 13 种操作,但尚未针对桌面操作系统级别的控制进行优化。开发者可通过 Google AI Studio 和 Vertex AI 访问此模型,Browserbase 也提供了演示环境。
(科技圈)
via 茶馆 - Telegram Channel