https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
博通扩大与Google、Anthropic的芯片合作

博通已同意为Google生产未来版本的人工智能芯片,同时还扩大了与 Anthropic 的合作,为这家 AI 初创公司提供约 3.5 吉瓦的算力,所用基础设施来自Google的 TPU 处理器。 这一消息显示,生成式 AI 对底层算力和定制芯片的需求仍在快速攀升,而大型科技公司正通过更深度的供应链绑定来确保后续供给。

报道称,Google与博通的合作重点是下一代定制 AI 芯片以及面向其数据中心机架的网络和配套组件,协议最长可延续至 2031 年。 这意味着博通不再只是单纯供应零部件,而是进一步嵌入Google AI 基础设施的长期规划之中,强化其在定制 ASIC 市场的角色。

Anthropic 方面则获得了更大规模的 TPU 计算资源,相关扩展容量计划从 2027 年开始逐步落地。 该安排与博通此前披露的多吉瓦级算力供给目标一致,也反映出 Anthropic 在 Claude 产品热度提升后,正持续加码训练与推理能力建设。

资本市场对这笔消息反应积极,博通股价在盘后交易中上涨约 3%。 分析人士认为,这类协议进一步印证了 AI 基础设施投资并未放缓,反而正沿着“定制芯片 + 云算力 + 长期供货合同”的模式持续扩张。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
OpenAI敦促监管部门调查马斯克 指其涉嫌反竞争、阻碍AGI落地

当地时间周一,OpenAI正式向美国加州和特拉华州的总检察长提出请求,敦促监管部门对马斯克及其关联方的行为展开调查,直指马斯克存在不当和反竞争行为。

作为OpenAI在2015年的共同创立者之一,马斯克于2018年退出后,迅速创立了竞争对手xAI公司,并推出了聊天机器人Grok,双方自此展开了激烈的商业竞争。

到了2024年,马斯克正式起诉OpenAI及其CEO奥特曼,指控公司在重组为营利性实体的过程中,公然违反了成立初期设定的非营利创始使命,将技术利益置于人类福祉之上。

针对马斯克的指控,OpenAI在法庭文件中也抛出了重磅反击。

他们披露马斯克曾试图拉拢扎克伯格共同参与对OpenAI的收购要约,但这一提议最终因后者未加入而作罢。

OpenAI指出,马斯克在诉讼中要求其非营利基金会赔偿超过1000亿美元,这一天文数字一旦执行,将实际上使整个非营利组织陷入瘫痪,彻底失去运作能力。

OpenAI的首席战略官对此表示忧虑。他认为,这场法律诉讼可能会严重破坏公司原本的努力方向,即确保AGI能够真正造福于全人类,而非被资本争夺所裹挟。

目前,加州奥克兰的一名法官已经裁定,该案件将正式交由陪审团进行审理。根据法庭排期,这起重量级官司预计将于今年4月正式开庭。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
微软引入高温超导技术:让数据中心电力传输“零损耗”

据报道,微软正深入研究 高温超导(HTS)技术。该技术旨在通过实现电流的“零电阻”传输,彻底改写云端配电模式,为 AI 时代的高负载需求寻求最优解。

技术核心:实现电力传输的“步履无痕”

目前大多数数据中心仍使用铜或铝作为布线材料,而 HTS 电缆 展现出了颠覆性的优势:

零电阻特性: 电流在流动时几乎没有损耗与电压降,且不会产生热积聚,彻底打破了输电距离的物理限制。

极致紧凑: 相比传统线缆,HTS 电缆更轻、更细。在直接向服务器机架供电时,其尺寸可缩小一个数量级。

高电力密度: 在不增加物理占地的前提下,极大提升了变电站与机房之间的电力负载上限。

核心底座:可扩展的高可用冷却系统

高温超导并非新概念,但直到近期制造工艺与经济性实现突破,才具备了在云端大规模应用的可行性。微软的技术方案关键在于构建一套 可扩展的高可用冷却系统,将电缆维持在必要的低温环境,确保算力集群在高负荷下依然能稳定运行。

生态赋能:从“芯片端”到“社区端”的全面优化

微软正通过多方协作,将前沿科学转化为工业生产力:

携手 VEIR: 微软云运营团队已与VEIR完成了3MW 超导电缆的出厂测试。其 CEO 蒂姆·海德尔指出,超导体将彻底改变从发电端到芯片端的整个电力价值链。

提升电网韧性: 在芝加哥,美国超导公司 (AMSC)已助力联邦爱迪生电力公司通过超导技术完成变电站互联。

低侵入性: 由于系统更小巧、安静且无需大型变电站设施,HTS 技术显著降低了电力基建对周边社区的影响。

行业观察:定义下一代数据中心架构

微软全球基础设施营销总经理阿利斯泰尔·斯皮尔斯强调,电力供应已成为 AI 扩张的最大瓶颈。引入超导体不仅是为了降本增效,更是为了构建能动态扩展、甚至催生全新形态的基础设施。

结语:当算力不再受限于铜线

从尖端的散热系统到高温超导电力方案,微软正在通过底层物理架构的重塑,为全球云服务构建一个更快速、更绿色且具备无限扩展可能的未来。

via AI新闻资讯 (author: AI Base)
中国 AI 大模型连续五周领跑全球,调用量大幅增长

据 OpenRouter 最新数据,2026 年 4 月 6 日,中国 AI 大模型的调用量在过去一周内达到了 12.96 万亿 Token,环比增长 31.48%。这一表现使得中国的 AI 大模型在全球范围内的调用量连续五周超越美国,彰显了中国在这一领域的强劲实力。

在全球范围内,AI 大模型的总调用量在 3 月 30 日至 4 月 5 日之间达到了 27 万亿 Token,环比增长 18.9%。其中,中国的 AI 大模型表现尤为突出,已占据了全球调用量前六位的所有席位。阿里巴巴的 Qwen3.6 Plus(免费版)以 4.6 万亿 Token 的周调用量高居榜首,成为当周最受欢迎的模型。此外,Qwen3.6 Plus Preview 以 1.64 万亿 Token 位列第三,而小米的 MiMo-V2-Pro 则因周调用量下降至 3.08 万亿 Token,退居第二。

在此期间,阶跃星辰的 Step 3.5 Flash(免费版)以 1.26 万亿 Token 排名第四,MiniMax M2.7 与 DeepSeek V3.2 则并列第五,周调用量均为 1.19 万亿 Token。相比之下,美国的 AI 大模型周调用量为 3.03 万亿 Token,仅环比增长 0.76%。这种巨大的差距显示出中国在 AI 大模型领域的快速发展和市场占有率的提升。

近年来,中国 AI 技术不断迭代,应用场景也在持续扩大,这一发展趋势不仅提升了中国在全球 AI 产业中的竞争地位,还为数字经济的发展注入了新的动力。中国 AI 大模型的领先地位,标志着其角色从 “跟跑者” 逐渐转变为 “领跑者”,为未来的技术革新奠定了基础。

划重点:

中国 AI 大模型调用量达到 12.96 万亿 Token,环比增长 31.48%。

前六名全球 AI 大模型均由中国企业占据,阿里巴巴的 Qwen3.6 Plus 位居榜首。

中国 AI 技术不断迭代,市场占有率显著提升,推动数字经济发展。


via AI新闻资讯 (author: AI Base)
OpenAI 指控马斯克反竞争行为,呼吁美国展开调查

OpenAI 向美国加州和特拉华州的总检察长发出呼吁,要求对埃隆・马斯克及其关联方的不当和反竞争行为进行调查。OpenAI 在信中指出,马斯克正通过提起诉讼和联合竞争对手等方式,试图阻碍公司的发展,妨碍其实现通用人工智能(AGI)的使命。双方的诉讼案件预计将在本月进行庭审。

马斯克在 2024 年起诉 OpenAI 及其首席执行官萨姆・奥特曼,声称在 OpenAI 转型为营利性机构的过程中,违反了其创立的初衷。值得注意的是,马斯克是 OpenAI 的联合创始人之一,但在 2018 年选择离开,并随后创办了竞争对手 xAI,推出了其聊天机器人 Grok。

在去年的一份法庭文件中,OpenAI 曾表示,马斯克试图说服竞争对手马克・扎克伯格加入其对 OpenAI 的收购要约,但扎克伯格并未参与。OpenAI 首席战略官杰森・权在信中提到,马斯克提起的诉讼要求其非营利基金会赔偿超过 1000 亿美元,这将对 OpenAI 造成严重打击,甚至可能使其面临瘫痪的风险。

杰森・权还强调,这一诉讼可能会破坏 OpenAI 确保通用人工智能造福全人类的努力。他表示,马斯克在诉讼中的文件显示,加州总检察长办公室未对 OpenAI 的资本重组计划进行全面调查,而是依赖于对 OpenAI 未来行动的承诺。此案件将在一名加州法官的主持下,由陪审团审理,预计将于 4 月开庭。

划重点:

📩 OpenAI 呼吁美国总检察长对马斯克的反竞争行为展开调查。

💼 马斯克于 2024 年起诉 OpenAI,指控其在转型过程中违反创立初衷。

💰 诉讼要求 OpenAI 赔偿超 1000 亿美元,可能导致其面临瘫痪风险。


via AI新闻资讯 (author: AI Base)
红熊 AI 完成 2.1 亿元 A 轮融资:投后估值突破 15 亿

据媒体报道,企业级 AI 解决方案供应商 红熊 AI 已于近日完成 2.1 亿元 A 轮融资。本轮融资由华禹创投领投,老股东格睿丰投资、稼沃资本跟投,徐汇资本、上汽美元基金等多家机构参与。此外,创始团队成员也以本轮估值跟投约 3000 万元,显示了核心团队对公司前景的极强信心。

技术护城河:“记忆科学”赋能全模态大模型

成立于 2024 年 4 月的红熊 AI,在技术路线上展现了鲜明的差异化:

情节记忆能力: 致力于让 AI 具备类似人类的“情节记忆”,通过对过去经历的结构化存储与检索,提升 AI 在复杂环境下的感知与决策精度。

物理世界交互: 不同于纯文本对话模型,红熊 AI 侧重于全模态技术,旨在让 AI 在物理世界中实现更精准的行动与反馈。

资本节奏:估值翻倍在即,上市时间表明确

本轮融资后,红熊 AI的投后估值已超过 15 亿元。而这仅仅是其资本加速的开始:

A+ 轮前瞻: 公司目前已在洽谈 A+ 轮融资,预计于今年 7-8 月完成,届时估值有望翻倍达到 30 亿元

IPO 路线图: 创始人兼 CEO 温德亮透露,公司预计于 2027 年第 2-3 季度向港交所递交招股书,并计划在 2028 年正式启动上市流程。

行业观察:具身智能时代的“记忆补完”

在大模型竞速的下半场,如何让模型不再“转头就忘”是通往通用人工智能(AGI)的关键。红熊 AI 通过“记忆科学”切入企业级市场,不仅解决了 AI 处理长时序任务的痛点,也为工业、物流等需要持续学习的物理场景提供了新的解法。

结语:从感知到记忆的跨越

估值的飞跃折射出市场对“记忆增强型 AI”的渴望。随着 A+ 轮融资的临近,红熊 AI 能否在 2028 年如约敲钟,将成为观察国内 AI 创业公司走向成熟的重要样本。

via AI新闻资讯 (author: AI Base)
OpenAI对AI经济的愿景:公共财富基金、机器人税与四天工作制

OpenAI发布了一系列政策提案,勾勒出智能时代财富与就业可能被重塑的路径。OpenAI的提案本质上是一份愿景清单、一份公开声明,帮助民选官员、投资者与公众理解这家公司如何看待人工智能重塑劳动力与经济的时代变局。OpenAI提出的框架围绕三大既定目标:更广泛地分配AI驱动的繁荣、构建降低系统性风险的防护机制、确保人工智能能力的普及,从而避免经济权力与机会过度集中。OpenAI提议将税收负担从劳动力转向资本。建议对高收入群体的企业收入、AI带来的收益或资本利得征收更高税率。OpenAI的多项提案也更聚焦劳动者权益,其中一项是补贴无薪资削减的每周四天工作制。

—— Techcrunch

via 风向旗参考快讯 - Telegram Channel
西班牙卫星公司 Xoople 获 1.3 亿美元融资:为 AI 打造地面真值数据

据媒体报道,总部位于西班牙的卫星初创公司 Xoople(发音同“zoople”)宣布完成 1.3亿美元 的 B 轮融资。本轮融资由 Nazca Capital 领投,参投方包括 MCH Private Equity、西班牙政府背景的科技发展基金 CDTI 等。

核心布局:打造 AI 模型的“地面真值”

不同于传统的卫星影像公司,Xoople 的定位非常明确——成为企业级 AI 应用的底层数据源:

专属星座: 正在开发专门用于收集精准数据的卫星星座,旨在为深度学习模型提供支撑。

技术跨越: 首席执行官 Fabrizio Pirondini 表示,其传感器收集的数据流质量将比现有监测系统提高 两个数量级

生态嵌入: 公司的商业模式核心是将数据直接嵌入微软、Esri 等企业级平台生态,让政企客户无需跨平台即可调用高精度地理信息。

强强联手:与美国国防承包商 L3Harris 达成合作

在融资的同时,Xoople 还宣布与美国航天及国防承包商 L3Harris Technologies 达成协议:

定制传感器: L3Harris 将为 Xoople 的航天器制造先进的光学传感器。

独角兽地位: 虽然 Pirondini 未透露具体估值,但他确认公司已进入“独角兽(10亿美元)”阵地,目前累计融资额已达2.25亿美元。

差异化竞争:在拥挤的赛道中寻找“结构化”优势

目前,全球地球观测领域已有 Planet、BlackSky 及欧洲的 Airbus 等成熟巨头。Xoople 的破局点在于:

先造“管道”: 在拥有自己的卫星数据之前,公司已通过整合欧洲航天局 Sentinel-2等公开数据,在微软等平台上铺设好了分发渠道。

世界模型: 公司的远景是建立“地球系统记录”,并最终与合作伙伴共同开发真正的“AI 世界模型”。

via AI新闻资讯 (author: AI Base)
腾讯推出 “探梦 DreamNow” 平台:用户可创作 AI 互动视频与影游

据《读佳》报道,腾讯正开发新开发的互动平台 “探梦 DreamNow”。该平台致力于为用户提供 AI 生成内容(AIGC)的创作与展示功能,目前尚处于研发阶段。用户不仅可以观看他人创作的 AI 视频和图片,还可以参与到互动影游的创作与展示中。

在 “探梦 DreamNow” 的首页,用户能够浏览各类 AI 生成的视频与图片,支持点赞、评论、收藏和转发等互动功能。用户的观看和收藏记录会被保存在个人中心,方便日后查看。值得一提的是,平台提示用户其创作功能即将上线,这意味着未来用户将能够自主创作 AI 视频、图片和互动影游,扩展自己的创作空间。

目前,该平台已上线一款名为《魏晋风骨》的互动影游。用户在游戏中通过选择不同的剧情分支,做出与魏晋时代背景相符的角色选择,从而解锁不同的故事情节和结局。游戏界面采用了魏晋国风美学设计,结合了 AI 生成的视觉元素,给人以古朴而优雅的体验。

此外,腾讯在互动影游领域的布局也并非孤军奋战。字节跳动、芒果 TV 等公司也已在此领域有所动作。然而,由于 “探梦 DreamNow” 目前功能尚不完善,创作模块的开放时间、互动影游的创作门槛、工具丰富度及后续内容生态的运营策略都将直接影响其未来发展。

划重点:

🌟 用户可观看和创作 AI 生成的视频和图片,享受互动体验。

🎮 目前上线的互动影游《魏晋风骨》支持玩家通过选择剧情分支来影响故事走向。

🚀 腾讯正与其他公司竞争,努力推动互动影游及 AIGC 内容创作的进程。


via AI新闻资讯 (author: AI Base)
苹果、亚马逊、OpenAI 遭集体起诉:涉嫌非法爬取 YouTube 数据

据媒体报道,针对苹果、亚马逊以及OpenAI的多项集体起诉已正式提起。原告方指控这些科技巨头绕过了YouTube的反爬虫防护机制,非法下载并使用了数百万条视频数据来训练其 AI 模型。

核心指控:Panda-70M 数据集背后的“搬运”真相

本次诉讼由 Ted Entertainment、Matt Fisher 和 Golfholics 三个 YouTube 频道共同发起,争议焦点指向了一个名为 Panda-70M 的数据集:

数据索引化: 该数据集通过网址、视频 ID 和时间戳,将海量视频拆分为数千万个独立的训练样本。

规避行为: 原告指出,为了提取这些片段,苹果等公司的研究团队必须频繁访问并截取原视频内容。这一过程被指故意绕过了YouTube为保护原创者而设立的版权保护系统。

证据确凿: 苹果团队在关于视频生成模型 STIV 的研究论文中,曾公开提及使用该数据集进行训练。

诉讼诉求:要求陪审团审理并索赔

原告方代表所有“处境相同”的内容创作者,向法院提出了多项严厉主张:

法定赔偿: 依据美国版权法,要求按法律最高限额进行金钱赔偿。

禁令救济: 要求被告及其关联方立即停止侵权行为,不得继续使用受版权保护的内容训练模型。

公平审查: 申请判令支付判决前后的利息,并由被告承担律师费与诉讼成本。

行业背景:AI 时代的“公地悲剧”

这并非 AI 巨头首次因训练数据身陷囹圄。随着大模型对高质量视频数据需求的激增,如何在保护创作者权利与推动技术进步之间寻找平衡,已成为全球科技监管的难点。

OpenAI 的压力: 继马斯克的反竞争诉讼后,OpenAI再次面临关于数据来源合法性的道德拷问。

苹果的转型挑战: 一向强调隐私与版权保护的苹果,在此次事件中被指“故意规避保护系统”,对其品牌形象构成了不小的冲击。

延伸动态:人才争夺战愈演愈烈

在法律纠纷之外,巨头间的暗战早已升级。据相关报道,苹果正试图通过发放高额奖金,阻止其核心工程师跳槽至OpenAI。而OpenAI则在持续从苹果硬件团队中挖角,旨在为未来的 AI 硬件布局。

结语:原创者的集体反击

当 AI 生成的视频越来越趋于真实,其背后的“原材料”归属权正成为不可回避的法律红线。这场集体诉讼的走向,或将为全球 AI 训练数据的合法使用边界定下重要基调。

via AI新闻资讯 (author: AI Base)
Anthropic 与谷歌、博通签下新算力协议,下一代 TPU 容量将自 2027 年起上线

Anthropic 宣布与谷歌和博通签署新协议,获得多吉瓦级下一代 TPU 算力,预计自 2027 年起陆续上线,用于支撑 Claude 前沿模型训练和全球客户需求。新增算力中的绝大部分将部署在美国,这也是其在 2025 年 11 月提出 500 亿美元美国计算基础设施投资承诺后的又一次扩张。

Anthropic 称,这是公司迄今最大规模的算力承诺。其 2026 年收入年化运行率已超过 300 亿美元,高于 2025 年底约 90 亿美元;年化支出超过 100 万美元的企业客户数量也已从今年 2 月披露的 500 多家增至目前的 1,000 多家。公司同时表示,将继续同时使用 AWS Trainium、谷歌 TPU 和英伟达 GPU,亚马逊仍是其主要云服务提供商和训练合作伙伴。

Anthropic

🌸 在花频道茶馆讨论投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
Claude Code 源码里有意思设定:伪造、投毒、卧底、封号

via 掘金人工智能本月最热 (author: 恋猫de小郭)
博通同意与谷歌、Anthropic扩大芯片合作

博通周一表示,公司已同意为谷歌生产未来版本的人工智能芯片,并与Anthropic签署了一项扩大协议,该协议将赋予这家AI初创公司访问约 3.5 吉瓦计算容量的权限,这些容量依托于谷歌的AI处理器。这份证券文件中的披露突显了对于能够运行生成式AI模型的基础设施的激增需求。Anthropic的年化收入已超过300亿美元,高于去年年底约90亿美元,这家初创公司在一篇博文中表示。该公司拥有超过1000家每年花费超过100万美元的商业客户,是两个月前数量的两倍。大部分新基础设施将位于美国,Anthropic表示。

—— CNBC

via 风向旗参考快讯 - Telegram Channel
Word 迎来最强“搭子”!微软 iOS 版开启 Copilot 协同创作测试

4月6日,微软发布博文宣布,正式邀请 Microsoft365Insider 项目成员在 iOS 版 Word 中测试全新的 Copilot 协同创作 功能。该功能由原先的 Agent Mode 更名而来,旨在通过自然语言交互,彻底改变移动端文档的生产效率。

核心亮点:自然语言“即刻成文”

持有Copilot许可证的 iOS 用户现在可以在文档中直接呼唤 AI 助手:

● 指令驱动: 用户只需点击文档内的 Copilot 图标并输入想法,AI 即可根据指令自动生成草稿或完善现有内容。
● 引用增强: 微软引入了便捷操作技巧,用户可以通过输入“/”符号快速引用其他参考内容,让 AI 的输出更精准。
● 即时优化: 生成内容后,用户可以要求 AI 进一步调整语气、长度或结构。

协作机制:安全第一,拒绝“自作主张”

针对共享文档的复杂协作场景,微软专门设计了严谨的安全确认机制:

● 预览核验: 在共享模式下,Copilot 的修改建议会先在聊天窗口展示预览,只有经用户确认后才会应用到正式文档中。
● 一键回溯: 若 AI 的修改不符合预期,用户可以利用撤销功能或通过历史版本快速找回原始数据,有效防止误操作。

现状限制:仍有“进化”空间

虽然功能强大,但目前的测试版本仍存在部分技术短板:

● 无法“白手起家”: Copilot 尚不能直接创建新文档,用户需先手动建立文件。
● 多媒体缺失: 暂不支持在文档内直接生成图片,需跳转至 Copilot Chat 完成。
● 评论锚点漏洞: 目前无法添加或修改评论,且在替换带有锚点评论的内容时,可能会导致原评论被误删。

行业观察:移动办公的“AI 主权”

随着 Gemma4 等大模型在效率上的不断突破,大厂们正加速将 AI 能力下沉到具体的应用场景中。微软此次更新不仅是功能的叠加,更是其“AI First”战略在移动端的深度落地。

结语:让灵感不再受限于屏幕

当 Word 拥有了“大脑”,手机屏幕不再是生产力的瓶颈。随着测试的深入和限制的解除,协同创作或将成为未来职场人的标准配置。

via AI新闻资讯 (author: AI Base)
腾讯 AI 新平台“探梦 DreamNow”曝光:人人都可创作 AI 大剧

据4月7日相关媒体报道,腾讯正在研发一款名为 “探梦 DreamNow” 的全新 AI 产品。这不仅是一个 AIGC 内容的展示空间,更是一个集创作、社交、互动于一体的多功能平台。

核心亮点:互动影游的“全民创作”时代

与市面上常见的 AI 展示平台不同,“探梦 DreamNow” 最具杀伤力的功能在于对“互动影游”的支持:

● 沉浸式体验: 用户不仅能观看 AI 生成的视频和图片,还能直接参与创作具备多分支剧情的互动作品。
● 低门槛创作: 平台拟开放创建功能,意味着普通用户也有机会利用 AI 工具,像制作幻灯片一样编排属于自己的互动数字内容。

实测案例:国风新作《魏晋风骨》先行

目前,平台内已展示了一款名为 《魏晋风骨》 的互动影游样本,展现了极高的视觉完成度:

● 美学风格: 画面基调深度贴合魏晋时期的国风美学,AI 生成的视觉效果配合古朴字体,氛围感拉满。
● 交互逻辑: 界面布局简洁,用户通过选择不同的剧情分支,即可解锁多样化的人物抉择与故事结局。

平台功能:打造 AI 版“社交社区”

“探梦 DreamNow” 在社交维度上也进行了深度布局:

● 作品交互: 首页支持展示用户创作的 AI 视频与图片,支持点赞、收藏、评论及一键转发。
● 个人中心: 提供完整的浏览与收藏记录管理,方便用户随时回看心仪的 AI 作品。
● 即将来袭: 根据个人中心页面显示,“创建”功能已进入开启倒计时。

行业观察:腾讯在 AIGC 赛道的“深度卡位”

从单纯的“看”到深度的“玩”,腾讯此次曝光的 “探梦 DreamNow” 显然是想利用其在游戏与影视领域的基因,挖掘 AIGC 的长尾价值。互动影游作为一种极具潜力的媒介形式,在 AI 的赋能下,生产成本有望大幅降低,从而催生出海量的个人 IP 作品。

结语:AI 创作的下一个出口

虽然产品目前仍处于打磨研发阶段,但 “探梦 DreamNow” 的出现无疑为 AIGC 开发者指明了一个新方向:AI 不止于对话和生成,更在于构建能够互动的数字世界。

via AI新闻资讯 (author: AI Base)
谷歌发布首款离线 AI 听写应用 Eloquent:手机秒变专业速录员

当地时间周一,谷歌正式在 iOS 平台推出了主打全离线使用的语音听写应用 Google AI Edge Eloquent。这款应用不仅打破了对网络环境的依赖,更凭借大模型的润色能力,直击语音转录中“废话多、不通顺”的行业痛点。

核心亮点:离线运行,隐私与效率兼得

Eloquent 的核心竞争力在于其完全基于本地算力的处理机制:

● 原生大模型驱动: 该应用基于谷歌轻量化模型 Gemma 构建,在完成对应的 ASR(自动语音识别)模型下载后,即可实现100% 离线工作。
● 隐私护城河: 所有音频处理均在本地设备完成,有效解决了商务会议、私人访谈等高敏感场景下的数据泄露隐忧。

特色功能:智能“去水”与文本润色

不同于传统的机械式听写,Eloquent 具备极强的理解能力:

● 自动剔除语气词: 系统能精准识别并自动过滤掉“嗯、啊、那个”等无意义语气助词,输出更为精炼的文本。
● 文本自动润色: 在转录过程中提供实时润色,使口语表达转化为更具逻辑性的书面语言。
● 灵活处理模式: 用户既可选择极致隐私的本地处理,也可调用云端 Gemini 模型进行更高质量的深度优化。

生产力工具:深度适配专业场景

为了满足专业用户需求,谷歌在细节功能上进行了大量打磨:

● 自定义词汇: 支持导入特定行业术语或自定义词汇,显著提升生僻词识别率。
● 多格式转换: 转录完成后支持多种文件格式导出,方便后续编辑与分享。
● 智能检索: 内置会话历史管理系统,支持通过关键字快速定位历史录音内容。

行业观察:端侧 AI 正在接管“工具类”应用

Google AI Edge Eloquent 的发布,标志着谷歌正在加速将大模型能力下沉到端侧硬件。虽然目前该应用仅上线了 iOS 平台,但官方已明确表示后续将适配安卓系统。对于同类 AI 转录产品而言,谷歌凭借模型底座与免费策略的入局,无疑将加速该赛道的洗牌。

结语:告别“后期整理”的烦恼

当 AI 能够离线过滤废话并自动润色,语音听写将不再只是记录工具,而是真正的生产力加速器。对于频繁需要整理录音的媒体人、学生和办公族来说,这款“语气词杀手”或许将成为手机里的标配。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]