🤖 Google 发布 Gemini 2.5 Computer Use 模型:AI 可像人类般操作浏览器

Google 近日推出了 Gemini 2.5 Computer Use 模型,该 AI 模型基于 Gemini 2.5 Pro 的视觉理解和推理能力,旨在像人类一样在浏览器中导航和交互。它能够分析用户请求并执行任务,包括填写和提交表单、点击、滚动和输入文本等操作。该模型在多个网络和移动控制基准测试中表现优异,并具有更低的延迟。Google 表示,该模型主要针对网络浏览器进行了优化,目前支持 13 种操作,但尚未针对桌面操作系统级别的控制进行优化。开发者可通过 Google AI Studio 和 Vertex AI 访问此模型,Browserbase 也提供了演示环境。

(科技圈)

via 茶馆 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]