https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
你的浏览器免费变身 AI Agent!腾讯推出国内首个浏览器“龙虾”QBotClaw:微信扫码远程操控

4月8日,腾讯云正式发布国内首个浏览器智能体“龙虾”——QBotClaw,将 AI Agent 能力原生集成到 QQ 浏览器中。这款工具让浏览器从单纯的网页访问工具升级为能够理解屏幕、自主执行复杂任务的智能助手,用户只需一句话即可指挥浏览器完成操作。

零设置免费使用,支持自带大模型

QBotClaw 开箱即用,无需订阅、无需复杂配置。用户打开 QQ 浏览器,在侧边栏即可下载安装。它支持用户自行配置主流大模型 API 密钥(Bring Your Own LLM),灵活适配不同需求。目前 Mac 版本已上线,Windows 版本即将推出。

首创微信远程控制,实现手机指挥电脑

QBotClaw 的最大亮点在于支持微信远程控制。用户通过微信扫描 Clawbot 二维码即可绑定,实现手机与电脑的远程连接。即使电脑处于锁定或空闲状态,用户也能通过微信发送文字或语音指令,远程指挥电脑执行任务,如文件整理、浏览器自动化操作等。这一功能让 AI 真正成为微信里的“联系人”,随时随地远程办公。

精准页面理解与自主行动

得益于腾讯自研的浏览器 Skill 和 X5高精度识别技术,QBotClaw 能够精准读取页面内容、理解屏幕信息,并根据用户指令完成跨页面复杂任务。它兼容 OpenClaw 技能生态,支持文件操作、邮件处理、比价购物、多平台内容发布等实际场景,极大提升了生产力。

浏览器即 Agent:从工具到智能同事的转变

传统浏览器仅负责展示网页,而 QBotClaw 让浏览器本身成为一个可自主思考和行动的 Agent。它不仅能处理当前页面,还能结合上下文记忆进行连续操作,真正实现“说一句,浏览器帮你干完”。

这一产品的推出,标志着浏览器 AI Agent 在国内的加速落地,显著降低了普通用户使用 AI 自动化的门槛。无论是日常办公、内容创作还是开发场景,QBotClaw 都提供了低成本、高效率的解决方案。

目前 QBotClaw 已在 QQ 浏览器中开放安装,感兴趣的用户可直接体验。AIbase 将持续跟踪 QBotClaw 的实际使用反馈、Windows 版本上线进度以及更多技能扩展,欢迎读者分享使用心得

via AI新闻资讯 (author: AI Base)
即梦AI发布协作型叙事工具“小章鱼”Octo,首推VibeCreate创作模式

即梦AI于4月8日正式上线首个协作型AI叙事创作工具“小章鱼”Octo,并创新性地提出VibeCreate(氛围创作)模式,试图重塑AI内容生成的交互范式。 这一动作标志着AI创作从传统的“单向指令、结果交付”模式,向“同屏共创、深度协同”的合伙人模式演进。作为即梦在AI叙事领域的探索性尝试,Octo目前仅在Web端开放内测申请,尚未全量上线。

在核心技术层面,Octo支持“对话+多模态混合”的同屏共创,其搭载的智能Agent能实时感知界面内容与用户操作,通过图片、音频等多种形式与创作者进行异步并行的创意碰撞。该工具构建了从故事大纲梳理、核心资产构建到剧本分镜生成、短片成片输出的全流程制作闭环,并深度联动Seedance2.0、Seedream5.0Lite等即梦最新底层模型。

从行业视角看,继VibeCoding重构人与代码的关系后,即梦提出的VibeCreate模式进一步拓展了AI在创意产业的边界。通过将AI定位为“创意合伙人”,Octo不仅提高了生成效率,更确保了灵感在创作全链路中的承接与放大。这种协作型工具的出现,预示着AI视频创作正从单一的模型能力竞争转向工作流集成与交互体验的深度革新。

via AI新闻资讯 (author: AI Base)
腾讯云宣布5月9日起上调AI算力及容器服务价格,涨幅达5%

腾讯云今日宣布将于2026年5月9日起正式上调多项核心AI业务价格,标志着继阿里云与百度云之后,国内又一头部云服务商完成算力资源的结构性调价。

根据公告显示,此次价格调整涵盖了AI算力相关产品服务、容器服务TKE-原生节点以及弹性MapReduce(EMR)相关产品,上调幅度统一为5%。对于在生效日期前已购入相关服务的用户,其当前订单或计费周期内的价格暂不受影响,新资费标准将在下一个续费周期开始执行。

腾讯云方面表示,此举系因全球AI算力需求持续激增,核心硬件供应链成本大幅上涨,调价旨在保障服务质量及算力资源的持续供给。

via AI新闻资讯 (author: AI Base)
谷歌发布 Gemini「notebooks」功能:跨平台深度管理项目实战

据报道,谷歌发布了名为 「notebooks」(笔记本) 的新功能。该功能旨在通过集中管理特定主题的内容,让Gemini进化为用户的私人专属知识助理。

核心功能:让 AI 拥有“长效记忆”

与常规的即时聊天不同,「notebooks」功能更强调信息的高度整合与复用:

全素材整合: 允许用户将分散的文件、历史对话记录以及自定义指令(Personal Instructions)一并放入特定的“笔记本”中。

精准上下文调用: Gemini将以此为核心上下文进行理解和回答,确保建议和生成的内容与用户的特定项目高度一致。

生态无缝同步: 该功能支持与谷歌现有的NotebookLM进行同步,实现了从个人笔记到 AI 深度洞察的闭环。

权限与发布:谁能率先体验?

谷歌正采取逐步释放的方式推广这一功能,重点覆盖核心订阅群体:

首批用户: 本周起,该功能将率先向订阅了AI Ultra、Pro 和 Plus 计划的用户开放网页版。

全平台布局: 移动端(iOS 及 Android)以及免费版用户预计将在未来数周内陆续获得更新。

行业视角:从“对话框”到“工作空间”

此次更新反映了谷歌对 AI 交互范式的深度思考:

去碎片化: 过去用户需要反复复制粘贴信息,现在通过「notebooks」可以实现信息的“一次导入,长期使用”。

独立化演进: 近期动态显示,谷歌正在为Gemini等 AI 助手引入独立音量控制滑块等精细化功能,足见其在安卓系统及办公套件中的独立地位正日益巩固。

结语:AI 的下半场是“个性化”

当 AI 不再只是回答百科知识,而是能基于你提供的专属文件进行思考,它才真正具备了生产力属性。谷歌Gemini「notebooks」的上线,正是为了让每一位用户都能在海量数据中,构建出属于自己的智慧堡垒。

via AI新闻资讯 (author: AI Base)
拒绝“套壳”AI:微信公众号重拳打击非真人自动化写作

微信公众平台近日发布了针对“非真人自动化创作行为”的最新管理规则,旨在维护内容生态的原创性。多位创作者反映,后台文章因被判定为自动化生成而遭到批量删除,这标志着平台对AI滥用行为的监管已进入实操阶段。

明确三大违规红线

新规明确禁止利用AI、脚本或接口替代真人完成创作与发布。具体违规场景包括:完全脱离真人表达的AI生成或改写内容、通过程序托管进行批量连续发布,以及传播此类自动化创作的教程与服务。

即使部分创作者声称仅使用了第三方排版工具导入,或发布的是AI技术教程,若内容特征符合“非真人自动化”标准,仍会触发系统的违规判定。平台强调,内容必须承载创作者的真实思考与表达。

严厉处罚净化生态

对于违反规则的账号,微信将根据违规程度采取分级处罚。轻者将面临相关文章的流量限制或直接删除,严重者则会被限制账号功能甚至永久封禁,绝不容许自动化流水线内容稀释原创价值。

此举被视为公众号回归“内容为王”本质的重要信号。在AI工具普及的背景下,微信通过技术手段与规则约束,强制要求创作者在利用工具辅助的同时,必须保留人工审核与情感投入的底线。

via AI新闻资讯 (author: AI Base)
谷歌DeepMind CEO称正以初创公司模式重回技术巅峰

谷歌DeepMind首席执行官德米斯·哈萨比斯近日在播客节目中透露,为了在激进的AI竞赛中保持领先,这家科技巨头正在打破内部壁垒。通过整合全公司的算力资源与顶尖人才,DeepMind在过去两三年内成功实现了从“追赶者”到“领跑者”的身份转变,其运作效率已全面向初创公司看齐。

资源大整合重塑竞争力

哈萨比斯指出,算力已成为当前AI研究的最大瓶颈,谷歌通过将分散的资源集中化,确保了核心项目能够获得极致的支持。这种转型让公司不再纠结于内部多个版本的低效开发,而是能够以极高的专注度和速度,推动如Gemini等超大规模模型的迭代升级。

作为现代人工智能突破性成果的主要贡献者,DeepMind与谷歌大脑合并后的协同效应正逐步显现。哈萨比斯自豪地表示,行业内约90%的底层突破源自谷歌系实验室,而现在的组织架构让他们能够更灵活地应对来自OpenAI和Anthropic等对手的挑战。

速度与标准的管理哲学

这一“巨头初创化”的趋势并非谷歌独有,亚马逊与苹果的高管也曾多次表达过类似的经营理念。亚马逊CEO贾西曾强调,快速行动与高标准并不对立,而苹果创始人乔布斯也曾将庞大的苹果公司定义为“地球上最大的初创公司”,旨在保持组织的敏捷性。

对于谷歌而言,这种变革不仅是应对外部竞争的权宜之计,更是重塑技术前沿地位的必然选择。在AI领域步入深水区的今天,哈萨比斯领导的DeepMind正通过这种精简、快速的文化,试图在多个前沿领域持续占据统治地位。

via AI新闻资讯 (author: AI Base)
OpenClaw、Claude Code 等 Agent 为什么都选择 Node.js?

via 掘金人工智能本月最热 (author: 吴佳浩Alben)
字节跳动发布原生全双工语音大模型 Seeduplex:懂倾听、抗干扰

4月9日,字节跳动 Seed 团队正式发布原生全双工语音大模型 Seeduplex,标志着 AI 语音交互从传统的“回合制”向更贴近人类直觉的“实时自然交互”演进。作为豆包端到端语音模型的重大升级,Seeduplex 核心突破在于实现了“边听边说”的同步处理框架,从底层架构上释放了语音交互的自然感。目前,该技术已在豆包 App 全量上线,完成了全双工技术从实验室向亿级用户规模化落地的跨越。

Seeduplex 通过语音与语义的联合建模,显著提升了模型在复杂声学环境下的抗干扰能力。相比半双工方案,其误回复率与误打断率降低了50%,即便在导航干扰、多人混叠或环境杂音中,也能精准识别主用户意图并联动环境信息。

在对话节奏控制上,该模型引入动态判停技术,将判停延迟缩短约250ms,抢话比例下降40%,能敏锐区分用户的“思考留白”与“对话结束”。工程层面,团队通过投机采样与量化优化,在确保超低时延的同时解决了高并发下的卡顿挑战,使通话满意度绝对值提升8.34%。

Seeduplex 的落地不仅是交互效率的飞跃,更预示着感知、思考与执行一体化的未来趋势。随着后续视觉模态的引入,语音助手将向“听、看、想、说”多维协同的通用智能体深度进化,重塑智能硬件及多模态交互的行业标准。

项目主页:

https://seed.bytedance.com/seeduplex

via AI新闻资讯 (author: AI Base)
科技圈🎗在花频道📮:

Photo

NASA 公布“阿耳忒弥斯 Ⅱ”绕月飞越首批官方照片

NASA 公布“阿耳忒弥斯 Ⅱ”任务首批官方绕月飞越照片。这批照片由 4 名宇航员在 4 月 6 日执行月球背面约 7 小时飞越期间拍摄,呈现了部分此前无人见过的月面区域,也记录到一次罕见的太空日食。机组已用多台相机拍下数千张照片,更多影像预计将在接下来几天继续回传。

NASA

🌸在花频道茶馆讨论投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
MiniMax 发布 MMX-CLI:一行代码原生接入全模态模型

据报道,MiniMax 正式发布了专为 AI Agent 打造的命令行工具 —— MMX-CLI。这款工具的问世,意味着 Agent 在复杂编程与创作环境中的“生存能力”迎来了质的飞跃。

核心亮点:原生调用,告别 MCP Server

MMX-CLI 的核心价值在于极大地简化了 Agent 与大模型之间的交互逻辑:

● 零适配门槛: 接入后,Agent 可以在 Claude Code、OpenClaw 等主流开发环境中,实现对 MiniMax 最新全模态模型的原生调用。
● 全模态覆盖: 无论是复杂的代码编写、视频生成、语音合成,还是音乐创作,Agent 均可通过命令行直接驱动,无需再为每个功能适配繁琐的 API 接口。
● 架构减负: 开发者不再需要额外编写复杂的 MCP Server(模型上下文协议服务器),大幅降低了 Agent 系统的维护难度与响应延迟。

市场延伸:淘宝闪购 AI 店铺助手上线语音搜索

就在MiniMax赋能开发者的同时,AI Agent 在商业场景的落地也在提速:

● 一句话管店: 淘宝闪购 面向餐饮商家的 AI 店铺助手正式全量上线语音搜索功能。
● 复杂操作闭环: 这是行业内首个能通过语音指令直接调起执行窗口并完成闭环的商家 Agent 服务。商家只需通过语音说出“帮我查下昨天的异常订单”或“屏蔽那个恶意差评用户”,AI 即可直接执行操作,无需手动点选。

行业背景:AI Agent 正在接管“执行权”

MiniMax 的底层工具升级,到淘宝闪购的前端应用进化,反映出2026年 AI 产业的共同趋势:

● 从对话到执行: AI 不再只是“聊天”,而是作为具备手脚的 Agent 深入到编程、经营和创作的每一个实操环节。
● 降本增效: 无论是对于个人开发者还是百万级别的电商商家,AI Agent 的交互门槛都在大幅降低,生产力释放进入加速期。

结语:命令行里的“智能未来”

MMX-CLI 让 Agent 拥有了更丝滑的“器官”,AI 的角色正从辅助者变为真正的协同伙伴。在代码与语音的交织中,一个由 Agent 驱动的高效时代已初现端倪。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]