https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
谷歌的最新AI模型像人一样使用网络浏览器

谷歌公司正在预览一款全新的Gemini人工智能模型,该模型旨在通过浏览器浏览网络并与之交互,使AI智能体能够在原本为人而非机器人设计的用户界面中执行操作。这款名为“Gemini 2.5 Computer Use的模型,利用 “视觉理解与推理能力” 分析用户的请求并完成相应任务,例如填写并提交表单。该模型可用于用户界面测试,或用于操作那些仅面向人类用户、未提供 API 或其他直接接口的系统。此前此类模型已应用于谷歌AI模式中的智能体功能及研究原型项目“Mariner”。谷歌的新AI模型仅限于访问浏览器环境,无法操控整个计算机系统。新AI模型现已通过谷歌 AI Studio 和 Vertex AI 向开发者开放。

—— Theverge

via 风向旗参考快讯 - Telegram Channel
🌐 谷歌Gemini AI Plus廉价套餐扩展至77个市场

谷歌已将其价格敏感型Gemini AI Plus套餐扩展至全球77个国家和地区,新增36个市场,包括阿尔巴尼亚、阿尔及利亚、阿根廷、巴西、哥伦比亚、土耳其、南非和泰国等。该套餐价格明显低于每月20美元的AI Pro套餐,提供200GB存储空间、每月200个Whisk和Flow积分,以及更深度的Gemini服务集成和Deep Research功能。作为促销活动,符合条件的新用户可享受前六个月50%的折扣。此套餐主要面向价格敏感市场,预计不会扩展到欧洲、美国和英国等地区。

(科技圈)

via 茶馆 - Telegram Channel
📹 ChatGPT 悄然上线视频输入功能

ChatGPT 似乎已悄然更新,新增了视频输入功能。用户现在可以通过将视频从相册应用拖拽至 ChatGPT 应用的方式,上传并使用视频内容。

(科技圈)

via 茶馆 - Telegram Channel
#Update #Gemini

Gemini 2.5 Computer Use 模型作为一个专用的桌面系统 Agent 模型(主要面向浏览器优化)现已通过官方 API 推出。

via AI Copilot - Telegram Channel
Google 发布 Gemini 2.5 Computer Use 模型,可像人类一样操作浏览器

Google 推出了 Gemini 2.5 Computer Use 模型,这是一个专门设计用于在浏览器中导航和交互的 AI 模型。该模型基于 Gemini 2.5 Pro 的视觉理解和推理能力,能够分析用户请求并执行任务,如填写和提交表单、点击、滚动和输入文本等操作。

该模型在多个网络和移动控制基准测试中表现优异,延迟更低。Google 表示这个模型主要针对网络浏览器进行了优化,目前支持 13 种操作,但尚未针对桌面操作系统级别的控制进行优化。开发者可以通过 Google AI Studio 和 Vertex AI 访问该模型,同时 Browserbase 也提供了演示环境。

Google 官方博客 | The Verge

🍀在花频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
Python 3.14.0 正式发布,带来重大更新与性能提升

Python 官方于 10 月 7 日发布了 Python 3.14.0 正式版,这是 Python 编程语言的最新主要版本,相比 3.13 版本包含了众多新功能和优化。

自由线程 (无 GIL):正式支持 (PEP 779),为高并发应用解锁潜力。

实验性 JIT 编译器:内置于官方 macOS/Windows 发行版,旨在提升性能。

新型解释器:新增可选的 C 级尾调用解释器,在特定编译环境下可提速 3-5%,此为 CPython 内部优化。

asyncio 内省:新增 ps 和 pstree 命令行工具,可实时检查并可视化运行中异步任务的调用栈与等待关系,简化调试。

模板字符串 (t-strings):引入 PEP 750,提供 f-string 语法的可定制字符串处理。

多解释器:标准库现已支持在单进程内创建多个独立解释器 (PEP 734)。

官方 Android 支持:首次提供官方 Android 二进制发行版。

其他改进:延迟注解求值 (PEP 649)、Zstandard 压缩支持 (PEP 784),以及为 REPL 和多个 CLI 工具增加颜色与语法高亮。

Windows 安装:引入新的 Python 安装管理器,可通过 Windows 应用商店获取。

πthon

Python 3.14|Python Discuss

via WH-2099

🍀在花频道🍵茶馆📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
Google将AI Plus计划和AI模式扩展至数十个新国家

Google宣布将其AI Plus订阅计划和AI模式功能推广至更多国家和地区。继上个月在印度尼西亚首次推出价格实惠的AI Plus订阅,获得积极市场反馈后,Google已将该计划扩展至另外40个国家,今日再新增36国,使AI Plus目前在全球77个国家上线。

为吸引新用户,Google还宣布限时优惠:首六个月可享受五折订阅价。

AI Plus计划用户可获得以下主要权益:

GoogleGemini应用中的Nano Banana图像生成与编辑模型限额提升
Gemini应用以及Whisk和Flow图片、视频创作工具中的Veo 3 Fast视频生成模型限额提升
可在Gmail、Docs、Sheets等应用中访问Gemini服务
NotebookLM使用限额提升
在Google Photos、Drive与Gmail中获得200GB云存储空间

与此同时,Google宣布将Google Search中的AI模式(AI Mode)支持的语言和地区大幅扩展。目前支持超过35种新语言、覆盖40多个新国家和地区,总计全球逾200个国家和地区可用。AI模式采用Gemini模型驱动,允许用户用自然语言进行搜索并获得AI生成的智能回复,同时可在回复基础上继续追问。Google表示,使用AI模式的用户,其问题平均长度接近传统搜索的三倍。

Google搜索产品管理副总裁Hema Budaraju表示:“我们专为搜索定制的Gemini模型具备先进推理和多模态理解能力,能够充分把握各地语言的细微差别,确保AI模式在所有新语言中更具实用性和相关性。”

此次双重扩展,显示出Google“Gemini”AI模型正加速融入核心产品,并致力于惠及全球更广泛的用户群体。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
爆料称OpenAI正在测试ChatGPT“私信”功能

OpenAI正推动旗下产品ChatGPT向社交平台转型,目前已在内部测试中引入 “私信” 功能并同步开发用户名与个人资料系统,支持用户之间直接交流。这一举措若最终落地,或将彻底重塑ChatGPT的产品定位,从单一的大型语言模型交互工具升级为具备社交属性的AI平台。OpenAI此次测试的 “私信”功能允许用户创建专属用户名及个人资料,并可通过该系统与其他用户直接发送消息、分享对话内容或协作使用AI工具。突破了ChatGPT此前仅支持用户与AI单向交互的模式,使其具备 “人与人通过 AI 连接” 的社交属性。

—— 环球网BleepingComputer

via 风向旗参考快讯 - Telegram Channel
Google发布Gemini 2.5计算机使用模型

在今年早些时候的 Google I/O 开发者大会上,Google宣布将为 Gemini API 引入计算机使用功能。今天,Google发布了 Gemini 2.5 计算机使用模型,这是一个全新的专用模型,旨在为能够与用户界面 (UI) 交互的代理提供支持。Google声称,该新模型在多个 Web 和移动控制基准测试中均优于其他同类模型 。

Gemini API computer_use 工具的工作原理如下:

开发人员需要将用户请求作为输入发送给工具,其中包括环境的屏幕截图和最近操作的历史记录。
除了输入之外,开发人员还可以指定是否从支持的完整 UI 操作列表中排除功能,或者是否需要包含任何其他自定义功能。
该模型将分析接收到的输入并生成响应,这将是 UI 操作之一,例如单击或键入。
如果模型不确定,它甚至可能会请求最终用户确认。例如,如果该操作与购买商品有关,则需要用户确认。
然后,客户端代码执行接收到的操作,例如单击按钮或显示最终用户确认。
一旦操作完成,当前 GUI 的新屏幕截图和当前 URL 将作为函数响应发送回计算机使用模型,重新开始循环。
重复上述步骤,直至达到主要任务目标。

虽然 Gemini 2.5 计算机使用模型针对网页浏览器进行了优化,但 Google 声称该模型在移动 UI 控制任务中也表现出色。Google特别提到 ,该模型尚未针对桌面操作系统级别的控制进行优化。正如您在下面的基准测试中看到的,Gemini 2.5 计算机使用模型在几个关键基准测试中都取得了最佳结果。

Gemini 2.5 计算机使用模型现已公开预览,开发人员可以通过 Google AI Studio 和 Vertex AI 上的 Gemini API 访问它。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
🤖 Google 发布 Gemini 2.5 Computer Use 模型:AI 可像人类般操作浏览器

Google 近日推出了 Gemini 2.5 Computer Use 模型,该 AI 模型基于 Gemini 2.5 Pro 的视觉理解和推理能力,旨在像人类一样在浏览器中导航和交互。它能够分析用户请求并执行任务,包括填写和提交表单、点击、滚动和输入文本等操作。该模型在多个网络和移动控制基准测试中表现优异,并具有更低的延迟。Google 表示,该模型主要针对网络浏览器进行了优化,目前支持 13 种操作,但尚未针对桌面操作系统级别的控制进行优化。开发者可通过 Google AI Studio 和 Vertex AI 访问此模型,Browserbase 也提供了演示环境。

(科技圈)

via 茶馆 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]