https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
谷歌发布第八代TPU与Gemini企业代理平台,重新定义“代理企业”基础设施

在Cloud Next '26大会上,谷歌正式发布了一系列旨在构建“代理企业(The Agentic Enterprise)”的核心基础设施。此次更新涵盖了从底层算力到顶层协同应用的全面架构重塑,标志着 AI 竞争已进入以自主智能体(Agent)为核心的生产力时代。

底层算力:TPU 架构的“拆分”与“规模”革命

谷歌首次将第八代张量处理单元(TPU)拆分为两个专用版本:用于模型训练的 TPU8t 和针对推理优化的 TPU8i

● 规模效应: 谷歌放弃追逐单芯片峰值性能,转而押注集群规模。通过全新的 Virgo 网络,谷歌可将多达一百万个 TPU 连接成庞大集群。
● 推理优化: TPU8i拥有更大的片上 SRAM 以加速混合专家模型,配合全新的Boardfly拓扑结构,大幅降低了芯片间延迟。

软件生态:Gemini 企业代理平台与 Workspace 智能层

为了简化自主 AI 代理的开发与部署,谷歌推出了基于 Vertex AI 的 Gemini 企业代理平台:

● 自主能力: 平台引入了Agent Studio,允许代理执行多步骤流程并具备长期记忆,无需每一步人工确认。
● 安全加固: 针对代理可能带来的攻击面,谷歌推出了加密身份验证、异常行为检测及模拟测试工具。
● 数据打通: 全新 Workspace Intelligence 层连接了 Gmail、Docs 和 Drive 等应用,使Gemini3.1Pro及第三方模型(如Claude Opus4.7)能跨应用理解复杂关系。

通过这一整套“全家桶”式的技术输出,谷歌正试图在算力与应用端建立双重壁垒,将 AI 代理从实验室的“聊天助手”转化为企业内部的高效数字员工。

via AI新闻资讯 (author: AI Base)
谷歌Gemini深度集成Google Photos 支持从相册生成个性化AI图像

近日,谷歌为其 AI 助手 Gemini 推出了一项重磅功能更新。通过与Google Photos的深度绑定,Gemini 现在可以直接调取用户照片库中的视觉信息,用于生成更具个性化的 AI 图像。这意味着,当用户想要创作一张包含自己或家人的 AI 照片时,不再需要撰写如同“写小说”般详尽的外貌描述,AI 将自动根据相册中的真实影像补全细节,使生成的角色外观、个人风格与现实高度统一。

核心技术驱动:Nano Banana2模型与“个人智能”战略

这一功能的背后是谷歌近期升级的图像生成模型 Nano Banana2。该模型旨在通过更高效的路径,快速生成与用户生活密切相关的场景。此次更新也是谷歌“个人智能”(Personal Intelligence)战略的关键一环,旨在打通Gmail、地图及YouTube等全家桶应用,使 AI 能够结合用户的个人上下文提供更贴心的服务。

隐私边界引发关注:是智能助手还是“隐私黑洞”?

然而,这项深入用户私域数据的创新在发布之初便引发了广泛的隐私担忧。批评者指出,将个人回忆、家庭合影等敏感影像纳入“AI 内容工厂”,可能进一步模糊个人数据与 AI 生产资料之间的界限。尤其是在此前同类产品曾遭遇隐私反弹的背景下,谷歌如何处理这些私人影像显得格外敏感。

谷歌的回应:自愿加入与非训练用途

针对外界的疑虑,谷歌明确表示该功能并非默认开启,而是采用“选择加入”(opt-in)机制,用户拥有绝对的连接自主权。目前,该功能首批面向美国地区符合条件的 Google AI 订阅用户开放。在数据安全方面,谷歌强调 Gemini 不会利用用户的私人相册进行模型训练。此外,用户在生成图像后可以通过“来源”按钮回溯系统参考的具体照片,以确保生成过程的透明度。

尽管有了这些安全承诺,关于“AI 在私人相册中游走”的讨论依然热烈。在 AI 技术与个人隐私博弈的当下,谷歌的这一尝试无疑将成为未来技术伦理讨论的风向标。

via AI新闻资讯 (author: AI Base)
Anthropic 撤回 Claude Code 订阅限制测试,承认算力成本超出 Pro 套餐负荷

Anthropic近日针对2% 的新专业用户进行了定价测试,曾短暂将编码工具Claude Code从20美元的 Pro 订阅服务中移除,仅保留给更昂贵的 Max 套餐。

然而,由于公开定价页面及支持文档的变更引发公众批评,该公司随后迅速撤回了该变动并致歉。此次事件不仅揭示了 Anthropic 内部的产品策略波动,更折射出随着Claude Code和Claude Cowork等高强度智能体工具的普及,现有的订阅方案已难以覆盖其极高的计算成本。

据增长主管 Amol Avasare 透露,现有的 Max 套餐最初仅为高强度聊天场景设计,无法完全负荷计算密集型工具的运行压力。目前,全行业正面临严峻的计算能力危机,Anthropic 的 API 正常运行时间近期仅为98.95%,迫使部分如 Retool 等企业客户转向OpenAI。与此同时,GitHub Copilot已更改计费模式并暂停新用户注册,现货市场 GPU 价格上涨近48%,种种迹象表明,AI 服务的计费模式正从传统的代币计量向更高门槛的配额制或按流量计费转型。

这一趋势预示着 AI 行业已进入“算力配给时代”,大模型厂商必须在激增的 Agent 任务需求与有限的算力资源之间寻求新的定价平衡。

via AI新闻资讯 (author: AI Base)
新一代 Kimi K2.6 上线遭遇功能问题,月之暗面重置用户额度作为补偿

4月22日,@月之暗面 Kimi 发布了一则公告,针对近期新模型 Kimi K2.6上线期间出现的功能异常,表示将对所有用户进行额度重置作为补偿。Kimi K2.6于4月20日正式发布并开源,经过全面升级,提供了更强的代码编写能力、长程任务执行能力以及 Agent 集群的支持。

在公告中,月之暗面提到,由于 Kimi K2.6的上线引发了用户访问量的激增,导致了部分用户在使用过程中遇到排队和功能暂时不可用的情况。此外,后台系统在统计用户 Agent 额度时也出现了偏差,造成了一些用户权益被误扣的现象。为了解决这些问题,月之暗面决定将所有用户的当月额度恢复至100%,并将已使用的量清零,以此来让用户尽快回归顺畅的使用体验。

据悉,Kimi K2.6在多项测试中表现出色,包括博士级难度的 “终极人类考试”(Humanity's Last Exam)和评估真实软件工程能力的 SWE-Bench Pro 等,成绩与当前领先的闭源模型如 GPT-5.4、Claude Opus4.6和 Gemini3.1Pro 持平或优于它们。自发布以来,Kimi K2.6的功能吸引了大量用户,目前所有用户均可通过官方网站、最新版 Kimi 应用以及 Kimi API 和 Kimi Code 编程助手进行使用。

月之暗面表示,将继续关注用户反馈,力求为用户提供更好的服务体验,以满足日益增长的需求。

划重点:

🌟 Kimi K2.6上线后用户访问量激增,导致功能异常和权益误扣。

🔧 月之暗面决定全员额度重置,恢复所有用户当月额度至100%。

🏆 Kimi K2.6在多项行业测试中表现优异,与领先模型持平或优于。


via AI新闻资讯 (author: AI Base)
跨国网恋竟是AI骗局:印度医学生打造虚拟网红收割百万粉丝

美国科技媒体近日曝光了一起令人震惊的AI造假案。一名22岁的印度医学生萨姆利用AI技术,成功打造了一位名为“艾米丽·哈特”的虚拟美国网红。这位拥有金发碧眼、热爱户外运动的保守派女性形象,在短短四个月内便吸引了超过100万名粉丝。

萨姆精准捕捉了特定受众的情感与价值观需求,通过AI生成的图像展示其穿比基尼冰钓、手持步枪射击等极具辨识度的生活内容。这些虚拟影像让大量美国粉丝信以为真,不仅在评论区狂热示爱,还通过订阅和打赏为其贡献了每月数千美元的收入。

技术造假背后的利益链条

萨姆坦言,由于面临医学院高昂的学费压力,他听从了AI工具的建议,选择了忠诚度高且可支配收入丰富的赛道进行变现。他利用谷歌Gemini和Grok等先进工具生成内容,不仅实现了财务自由,更在幕后嘲讽受骗者的盲目。

这一事件曝光后引发了公众对政治与情感双重欺骗的愤怒,多方社交平台已介入调查。专家指出,随着AI生成技术的平民化,针对特定群体的“定制化”虚假人设已成为新型诈骗手段,公众亟需提高对网络虚拟形象的辨别能力。

via AI新闻资讯 (author: AI Base)
北京大模型备案量全国占比近三成, 225 款通过网信办审核,持续领跑AI产业高地

在人工智能大模型从技术爆发迈向合规落地的关键阶段,北京市正以显著优势巩固其“中国AI创新策源地”地位。据北京市经济和信息化局最新披露,截至目前,北京市已有225款大模型通过中央网信办生成式人工智能服务备案,占全国备案总量的约30%,稳居各省市首位,彰显其在政策、人才、技术与产业生态上的综合领先优势。

这一数据背后,是北京密集的AI创新主体布局:从百度“文心一言”、智谱AI“GLM”、月之暗面“Kimi”,到百川智能、MiniMax、深度求索(DeepSeek)等明星企业,众多头部大模型公司均扎根北京。依托中关村科学城、海淀AI创新走廊及国家新一代人工智能创新发展试验区等平台,北京已形成涵盖基础研究、模型训练、行业应用与安全治理的完整产业链。

值得注意的是,大模型备案不仅是合规门槛,更是市场准入的“通行证”。通过备案意味着模型在内容安全、数据来源、算法透明度等方面满足监管要求,可面向公众提供服务。北京企业在此环节的高通过率,反映出其在技术合规能力与工程落地成熟度上的双重领先。

此外,北京市近年来持续推出专项政策支持大模型发展,包括算力补贴、应用场景开放、人才引进等举措,并推动“模型+行业”深度融合,在政务、医疗、金融、教育等领域打造标杆案例。

随着全国大模型竞争从“参数军备赛”转向“合规化、场景化、商业化”深水区,北京凭借先发优势与制度创新,正加速构建“技术研发—安全合规—产业应用”的良性闭环。225款备案模型不仅是一个数字,更是中国AI迈向高质量发展的缩影——而北京,依然是这场变革的核心引擎。

via AI新闻资讯 (author: AI Base)
谷歌确认Gemini赋能新版Siri:苹果情境感知功能定档2026年发布

在近期举行的Google Cloud Next26大会上,谷歌官方正式确认苹果已选定其为首选云服务提供商,双方正基于Gemini模型共同开发下一代Apple Foundation机型。这意味着备受关注的个性化、具情境感知能力的全新Siri将于2026年正式亮相。此次合作的核心在于将Gemini强大的多模态处理能力与苹果的私有云计算架构相结合,旨在解决Siri长期以来在复杂指令遵循和跨应用意图识别上的短板。

自2024年WWDC展示“屏幕感知”愿景以来,苹果AI的落地节奏一直受到技术门槛的挑战。此次通过每年约10亿美元的投入,苹果成功将Gemini的大模型能力提炼至端侧可控版本,在确保用户隐私的前提下,大幅提升了iPhone及iPad等设备的智能化交互上限。这一动作标志着苹果正式从自研单一路径转向“自研+顶级外援”的双轨战略。

行业普遍认为,Siri的这次迭代不仅是交互形态的改变,更是AI智能体(Agent)步入严肃生产力的信号。随着2026年这一关键时间点的明确,全球智能终端市场或将迎来从“指令交互”向“意图理解”的全面范式转移,进一步巩固了谷歌在模型底层架构竞争中的领先地位,也为苹果赢得了追赶大模型第一梯队的门票。

via AI新闻资讯 (author: AI Base)
阿里通义千问再次“掀桌子”:Qwen3.6-27B正式开源,编程实力上演“以小博大”

4月22日,阿里云通义千问团队宣布其开源家族迎来重磅更新,正式发布270亿参数的稠密多模态模型——Qwen3.6-27B。作为开发者群体呼声最高的模型规格,该版本的出现不仅完善了Qwen系列的产品矩阵,更在保持稠密架构优势的基础上,针对智能体编程与多模态推理进行了深度进化。

性能飞跃:编程能力超越15倍规模的MoE模型

在本次发布中,最令业界关注的是其“以小博大”的惊人表现。尽管只有270亿参数,Qwen3.6-27B在多项编程基准测试中,全面超越了前代总参数量高达3970亿的Qwen3.5-397B-A17B。数据显示,在衡量代码修复能力的SWE-bench Verified测试中,该模型取得了77.2的高分;而在SkillsBench等推理任务上,其进步幅度更是显著。这种性能表现意味着,开发者无需复杂的MoE(混合专家模型)路由即可获得旗舰级的编程辅助体验,大幅降低了部署门槛。

全能多模态:支持图像视频混合输入

除了逻辑推理的强项,Qwen3.6-27B在视觉语言领域同样表现稳健。它原生支持多模态处理,能够流畅解析图像、视频与文本的混合输入,涵盖了视觉推理、文档深度理解以及交互式视觉问答等应用场景。官方表示,其多模态处理能力已与更高参数级别的Qwen3.6-35B-A3B保持一致,确保了多模态任务下的高精度产出。

生态对接:深度适配开发者主流工作流

为了让技术迅速转化为生产力,该模型的开源权重已同步上线Hugging Face和ModelScope(魔搭)社区,支持本地化部署。此外,阿里云百炼平台也将紧随其后提供API调用服务,并特别保留了“preserve_thinking”功能,以便在智能体任务中完整回溯思维链。目前,Qwen3.6-27B已实现对Claude Code、Qwen Code等主流编程助手的无缝集成,旨在为全球开发者提供更加精准、具备上下文感知能力的编码辅助环境。

via AI新闻资讯 (author: AI Base)
小米发布最强大模型系列,MiMo-V2. 5 正式开启公测

4月23日凌晨,小米在AI领域再次发力,正式推出了全新的MiMo-V2.5系列大模型并同步开启公测。此次发布不仅是产品线的简单更新,更是一次技术底座的全面跨越。系列共包含四款模型:MiMo-V2.5、V2.5-Pro、V2.5-TTS Series以及V2.5-ASR。其中,最受开发者关注的是,小米宣布将MiMo-V2.5-Pro与MiMo-V2.5两款核心模型面向全球开源,展现了其推动AI生态开放的野心。

旗舰性能:百万级上下文与复杂任务的“终结者”

作为该系列的顶级版本,MiMo-V2.5-Pro被定位为长难Agent(智能体)任务的专属利器。它支持高达100万Token的超长上下文,在处理复杂软件工程和长程逻辑任务时表现惊人。为了展示其硬实力,小米公布了一项实测案例:在开发北京大学《编译原理》课程中的SysY编译器项目时,原本需要本科生耗费数周的工作量,MiMo-V2.5-Pro仅用4.3小时便通过672次工具调用顺利完成,并取得了满分成绩。这种在长周期任务中保持逻辑一致性的能力,使其具备了与Claude Opus4.6、GPT-5.4等顶尖闭源模型正面抗衡的底气。

全模态进化:多面手与极高的“性价比”

与此同时,标准版的MiMo-V2.5则深耕原生全模态能力,打通了图像、音频与视频的综合处理路径。在权威的Agent评测榜单中,MiMo-V2.5不仅在推理速度上显著提升,其表现甚至超越了前一代的Pro版本。更令开发者欣喜的是,通过技术优化,其API调用成本降低了约50%。在跨模态推理、视频理解及专业图表分析等维度,MiMo-V2.5已逼近甚至在部分指标上超越了目前业界的顶级模型。

计费模式重构:用更少的Token做更多的事

除了性能的压制,小米还对底层效率进行了深度调优。数据显示,在同等测试基准下,MiMo-V2.5系列比同类竞争对手更节省Token。为了配合新模型的落地,小米全面升级了“Token Plan”订阅计划,彻底取消了不同上下文长度之间的计费差异,不再实施多倍率计费。此外,新推出的夜间优惠速率和自动续费模式,也进一步降低了企业和开发者步入大模型时代的门槛。

via AI新闻资讯 (author: AI Base)
小米 MiMo-V2.5震撼公测:4.3小时手搓编译器,长程智能体迎“满分”跨越

今日,小米正式宣布其 Xiaomi MiMo-V2.5系列大模型开启公测。该系列包含 MiMo-V2.5、V2.5-Pro 以及配套的 TTS 与 ASR 模型,标志着小米大模型从“能用”向“好用”的全面进化。

一、 性能旗舰:MiMo-V2.5-Pro 挑战复杂长程任务

作为该系列最强型号,MiMo-V2.5-Pro 在通用智能体能力与软件工程维度已能与 Claude Opus4.6及 GPT-5.4等全球顶尖模型正面角力。其核心优势在于极高的指令遵循度与自我修正能力:

● 编译器挑战: 在实现完整的 SysY 编译器任务中,该模型仅用 4.3小时、经历672次工具调用即完成全部工作,并以 233/233的满分通过测试。
● 自主开发能力: 仅凭简单指令,模型历经1,868次调用,独立构建出包含多轨道时间线等功能的 Web 视频编辑器(代码量达8,192行)。

二、 效率标杆:原生全模态与百万上下文

MiMo-V2.5 定位于原生全模态 Agent,支持看、听、读的一体化转化。

● 感知力飞跃: 在视频理解与图表分析等维度逼近顶级闭源模型,Agent 能力全面超越前代 Pro 版本。
● Token 效率革命: 针对 Token 效率深度优化,在相同基准下,其 Token 节省率较业界同类模型(如 Kimi K2.6、Muse Spark)高出 42% 至50%

三、 计费优化与开发者福利

为了让尖端模型更易触达,Xiaomi MiMo 开放平台同步推出了优化的 Token Plan:

● 倍率下调: 取消了256k 与1M 上下文的计费差异,MiMo-V2.5消耗倍率为1x,Pro 版本为2x。
● 时段优惠: 每日 00:00-08:00享受8折专属夜间速率。
● 订阅惊喜: 新增连续包月及包年折扣,且截至4月22日前的老用户 Credits 额度已获得全量重置清零

四、 未来展望

小米技术团队表示,MiMo-V2.5系列模型即将向全球开源。目前,用户已可通过Xiaomi MiMo Studio进行产品体验。从2.0版本发布到2.5版本的性能跃升,小米仅用了约一个月时间,展现了其在 AI 赛道上极速迭代的研发实力。

via AI新闻资讯 (author: AI Base)
OpenAI 推出 Workspace Agents:全天候办公时代开启

OpenAI 正式发布了专为团队协作设计的Workspace Agents(工作空间智能体)。这一全新功能旨在处理复杂且长周期的工作流,让 AI 从简单的对话助手演变为能自主执行任务的虚拟员工。

这些智能体在云端运行,支持全天候在线,即便团队成员处于离线状态,它们也能持续推进项目。无论是报告编写、代码审查还是消息响应,智能体都能跨越时区和工具障碍,实现无缝协作。

打破问答模式实现深度协作

与传统 AI 不同,Workspace Agents具备文件处理、代码运行及记忆存储能力。这意味着它们不仅能回答问题,还能根据过往交互不断优化表现,甚至自动在 Slack 等办公软件中提交工单。

在 OpenAI 内部,销售团队已通过智能体自动整理通话记录并筛选潜在客户。会计团队则利用该工具,将原本繁琐的月末结账流程缩短至数分钟,极大提升了企业的行政运转效率。

研究预览期后的阶梯计费

该功能目前已对 ChatGPT 商业版、企业版及教育版用户开放研究预览。在2026年5月6日之前,符合条件的用户可以免费体验这项前沿的自动化协作技术。

预览期结束后,系统将转为积分计费模式。OpenAI 计划在未来引入更多功能,包括自动触发器和性能分析仪表盘,帮助企业更直观地评估 AI 智能体带来的生产力增益。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]