谷歌的最新AI模型像人一样使用网络浏览器
谷歌公司正在预览一款全新的Gemini人工智能模型,该模型旨在通过浏览器浏览网络并与之交互,使AI智能体能够在原本为人而非机器人设计的用户界面中执行操作。这款名为“Gemini 2.5 Computer Use的模型,利用 “视觉理解与推理能力” 分析用户的请求并完成相应任务,例如填写并提交表单。该模型可用于用户界面测试,或用于操作那些仅面向人类用户、未提供 API 或其他直接接口的系统。此前此类模型已应用于谷歌AI模式中的智能体功能及研究原型项目“Mariner”。谷歌的新AI模型仅限于访问浏览器环境,无法操控整个计算机系统。新AI模型现已通过谷歌 AI Studio 和 Vertex AI 向开发者开放。
—— Theverge
via 风向旗参考快讯 - Telegram Channel
谷歌公司正在预览一款全新的Gemini人工智能模型,该模型旨在通过浏览器浏览网络并与之交互,使AI智能体能够在原本为人而非机器人设计的用户界面中执行操作。这款名为“Gemini 2.5 Computer Use的模型,利用 “视觉理解与推理能力” 分析用户的请求并完成相应任务,例如填写并提交表单。该模型可用于用户界面测试,或用于操作那些仅面向人类用户、未提供 API 或其他直接接口的系统。此前此类模型已应用于谷歌AI模式中的智能体功能及研究原型项目“Mariner”。谷歌的新AI模型仅限于访问浏览器环境,无法操控整个计算机系统。新AI模型现已通过谷歌 AI Studio 和 Vertex AI 向开发者开放。
—— Theverge
via 风向旗参考快讯 - Telegram Channel