https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
语音秒变亲友声!广汽本田 P7 开启 OTA 升级:AI 大模型正式上车

4 月 3 日,广汽本田 P7正式推送了智导互联 4.2.2 系统的 OTA 升级。本次更新的核心亮点在于 AI 大模型 的全面集成以及极具温情色彩的“声音复刻”功能,标志着本田在华纯电车型正式步入大模型原生驱动的新阶段。

核心亮点:AI 大模型变身“全能管家”

接入 AI 大模型 后,广汽本田 P7的座舱交互能力实现了质变:

● 旅行规划大师: 能够根据用户意图自动生成旅行攻略,提供保姆级的路线建议。
● 用车解惑: 告别翻阅纸质说明书,车主可直接通过语音询问各类用车功能与故障排查。
● 闲聊解闷: 语义理解能力大幅提升,支持更自然、更有逻辑的多轮对话。

温情科技:手机录制即可“复刻”亲友声音

本次升级中最具话题性的功能莫过于“声音复刻”:

● 情感交互: 用户通过手机 App 录制样本,即可将车机语音更换为爱人、孩子或亲友的声音,让冰冷的导航与播报充满家的温度。
● 主动问候: 新增语音助手在特定节日的自动问候功能,进一步强化了座舱的仪式感。

驾驶增强:模拟赛车声浪与头枕播报优化

为了提升驾驶乐趣与私密性,新版本在声场控制上也下足了功夫:

● 运动声浪 ASC: 一键开启模拟赛车运动声浪,配合 P7 四驱版 4.6 秒的百公里加速性能,沉浸式点燃驾驶激情。
● 头枕播报优化: 导航语音支持头枕双侧入耳,确保主驾指引清晰的同时,不干扰舱内其他乘客。

细节进化:香氛掌控与预约充电

在日常用车便捷性方面,广汽本田 P7也通过此次 OTA 进行了补完:

● 远程香氛系统: 手机 App 实时同步车载香氛状态,包括香型、余量及档位调节。
● 预约充电: 车主可直接在手机端设置预约充电时间段,利用峰谷电价降低用车成本。

车型背景:20 万级纯电 SUV 的智能先锋

广汽本田 P7作为广汽本田布局纯电市场的战略车型,于 2025 年 5 月开启首批交付。该车搭载云驰智能座舱,拥有 2930mm 的超大轴距,且同时支持 Apple CarPlay、华为 HiCar 及百度 CarLife 三大主流车机互联方案。

结语:传统合资巨头的“智电反击”

随着AI 大模型的上车,广汽本田正通过软件定义的持续进化,快速缩补合资品牌在智能化领域的短板。这种基于情感连接(声音复刻)与实用功能(旅行规划)的双向升级,为 20 万级纯电 SUV 市场提供了更具人性化的选购参考。

via AI新闻资讯 (author: AI Base)
红果短剧下架AI剧《桃花簪》:出品方涉“盗脸”侵权被停职

4月3日,短剧平台红果短剧正式发布公告,宣布全面下架AI短剧《桃花簪》并对出品方处以暂停上传剧集15天的处罚。此次下架源于多位博主投诉该剧在制作过程中未经授权擅自使用其面部形象进行AI处理,且涉及丑化角色。在平台给出的72小时审核期内,出品方因无法证明素材使用的合规性,被判定违反内容合规规定。

该事件始于3月31日,“AI短剧偷脸”话题引发社会广泛讨论。受害者包括汉服博主“白菜”及商业模特“七海”,两人均指出其个人妆造及面部特征被AI高度还原并植入剧集。此案再次推向了生成式AI技术在影视创作中肖像权认定的法律边界。专家指出,AI肖像权侵权的核心在于“可识别性”而非技术手段,即便制作方声称是软件随机生成,若结果与真人高度一致且无法证明创作独立性,仍需承担侵权责任。

随着生成式AI在微短剧领域的渗透,素材识别难度与侵权隐蔽性正成为行业治理的新挑战。此次事件标志着主流短剧平台对AI内容审核的颗粒度进一步收紧。在降本增效的行业趋势下,如何平衡AI技术应用与版权、肖像权的法理红线,已成为AI内容生态可持续发展的关键命题。

via AI新闻资讯 (author: AI Base)
人工智能公司 Ex-Human 起诉苹果,指控 App Store 审核不公

近日,一家名为 Ex-Human 的人工智能创业公司在美国对苹果公司提起诉讼,指控其在未提供具体证据的情况下,错误地下架了其应用,并拖欠约 50 万美元的收入。Ex-Human 的旗下应用 BotifyAI 和 PhotifyAI 曾在苹果 App Store 上架,但目前仍可在 Google 应用商店下载。

Ex-Human 曾因其服务涉嫌引发争议,包括未成年角色的色情化对话和生成真实人物的裸露图像。苹果公司对此表示,确保 App Store 符合规定是其责任,但如何执行这一责任常常难以界定。Ex-Human 在诉状中称,苹果在通知其下架时仅提到 “欺骗或欺诈性活动”,却没有提供任何详细的违规证据。

此外,Ex-Human 还表示,苹果在移除其应用后继续扣留其在 App Store 上产生的约 50 万美元收入,严重影响了公司的商业利益。Ex-Human 的商业模式采用 “少量免费token+ 高额订阅”,面向普通用户的月费起步为 50 美元,并有企业级套餐。

诉讼中,Ex-Human 认为苹果之所以特别针对其应用,是因为苹果推出了自家的图像生成功能 Image Playground,意图打压竞争。然而,公开信息显示,Image Playground 与 Ex-Human 的产品并无直接重叠,这一说法的合理性仍存疑。

值得注意的是,Ex-Human 的起诉可能与苹果在其他相似案例中的处理态度有关。比如,当埃隆・马斯克旗下的 xAI 面临类似争议时,苹果仍允许其应用在 App Store 中存在,引发外界对双重标准的质疑。苹果官方政策允许在满足一定条件下存在成人内容,但违法内容则是绝对禁忌。

目前,Ex-Human 的诉讼已提交至加州北区联邦地区法院,随着政治与监管环境的变化,法院如何裁定苹果在 App Store 审核规则中的解释空间,以及平台对第三方内容的责任,尚未可知。这场诉讼将可能成为苹果与 Ex-Human 之间复杂的法律和舆论博弈。

划重点:

🌟 Ex-Human 因苹果下架其应用而提起诉讼,指控苹果未提供具体证据。

💰 公司声称苹果拖欠约 50 万美元的收入,影响其商业利益。

⚖️ 此案引发对苹果审核标准及内容责任的广泛关注,涉及法律和舆论的复杂关系。


via AI新闻资讯 (author: AI Base)
蚂蚁GPASS再拓智能眼镜场景:一句话解锁共享单车

近日,千问AI眼镜接入蚂蚁GPASS,上线共享单车骑行与停车缴费等一系列“AI办事”功能。

基于GPASS底层能力,用户佩戴千问AI眼镜后,只需语音唤醒,即可完成多项高频生活服务。在出行场景中,“你好千问,我要骑车”,按提示注视车辆二维码即可完成核验开锁;抵达目的地后,说一句“你好千问,我要还车”即可自动还车并结算费用。全流程无需手动操作,真正实现无感化骑行。

据悉,停车缴费功能此次也同步上线千问AI眼镜。车辆进入停车场后,眼镜通过语音告知用户计费开始时间;离开停车场前,用户无需掏出手机扫码,仅需通过眼镜语音唤醒服务或扫描停车码,即可自动完成缴费离场。

在安全、连接和交互层面,GPASS为这些便捷体验提供了底层支持。它集成了声纹核身技术,用户在首次绑定支付宝账号后,后续所有支付流程可自动完成安全校验。同时,GPASS打通了千问AI眼镜与支付宝的出行生态,实现手机、眼镜端、车端的信息无缝流转,支付提醒可同步接收,充分贴合了骑行等双手被占用场景的实际需求。

自2025年在外滩大会发布以来,GPASS持续推动AI眼镜从基础交互设备向个人智能体演进。除共享骑行外,GPASS已助力智能眼镜实现“看一下”支付、唤醒AI健康助手“蚂蚁阿福”、文旅数字伴游等多项功能落地,让智能眼镜从单一交互设备向全能型随身智能终端稳步升级。

via AI新闻资讯 (author: AI Base)
谷歌发布 Gemini API 新定价策略,推理服务按需计费

谷歌近期对其 Gemini API 的计费结构进行了更新,旨在更好地满足用户的推理使用需求。这次更新带来了多种新的服务档位,包括标准、弹性、优先、批量和缓存版。用户可以根据自身的实际需求选择最合适的档位。

首先,标准档位提供了基础的推理服务,用户可以根据自己的使用情况进行选择。弹性档位则是一个创新的选择,它利用非高峰时段的闲置算力资源,为用户提供了标准价格的五折优惠。这个档位的目标延迟在 1 至 15 分钟之间,但并不保证固定的延迟时间,适合那些对时间要求不太严格的应用场景。

此外,批量档位同样为用户提供了标准费率的五折优惠,适合需要处理大量数据的用户,延迟时间最长可达 24 小时。此档位特别适用于大规模的数据处理场景,用户在进行大量信息查询时可以大大节省成本。

在缓存档位方面,计费将依据缓存的词元数量与存储时长进行,特别适合需要频繁调用复杂指令的对话机器人、长视频分析或大规模文档集的查询。这个档位使得用户能够有效管理存储和计算资源,提高系统的运行效率。

优先档位的定价则比标准价格高出 75% 至 100%,但能够在毫秒到秒级内控制延迟。这一档位非常适合那些需要实时响应的应用,如客服聊天机器人、实时欺诈检测和关键业务智能助手等场景。谷歌建议有需求的用户选择优先档位,以确保他们的应用程序在响应速度和效率上的最佳表现。

划重点:

🌟 新增多种 Gemini API 服务档位,满足不同用户需求。

弹性与批量档位提供五折优惠,适合大规模数据处理。

优先档位确保毫秒级响应,适合实时应用场景。

via AI新闻资讯 (author: AI Base)
阿里通义实验室发布Wan2.7-Video视频生成模型

通义实验室推出了全新的视频创作工具 Wan2.7-Video,旨在提升创作者的自由度与灵活性。针对当前 AI 视频创作领域中常见的两个主要问题 —— 内容生成不专业和视频修改困难,Wan2.7-Video 提供了一系列强大的功能,帮助用户轻松实现创作与编辑。

在内容生成方面,Wan2.7-Video 采用了更为先进的模型,支持文本、图像、视频和音频的全模态输入,用户可以在画面结构、剧情走向、局部细节等方面进行精确控制。这意味着用户可以像编辑文档一样,对视频内容进行修改,满足更高的创作需求。

该工具的超强编辑能力让视频的修改变得更加简单。用户只需通过指令即可对视频中的元素进行精准调整,诸如删除不需要的路人,或者替换视频中的物体。此外,用户还可以对背景环境进行转换,将夏季场景轻松变为秋冬,甚至一键实现风格切换,为视频增添丰富的视觉效果。

在拍摄剧情的修改上,Wan2.7-Video 让用户无需重新拍摄,通过简单的指令就能改变角色的台词、动作和镜头角度。用户可以根据自己的需求,灵活地调整视频中的角色表现和场景设定,极大提升了创作的便捷性。

此外,Wan2.7-Video 还具备创意快速复刻和剧情延续创作的功能,用户可以快速复用已有视频中的动作、镜头和特效,实现新的创意表达。通过精准的时序控制,用户能够实现视频的无缝衔接,增强故事的流畅性。

via AI新闻资讯 (author: AI Base)
AI 初创公司 Ex-Human 起诉苹果:指控其非法下架应用并扣留50万美元收入

人工智能初创公司 Ex-Human 近日正式起诉苹果公司,指控其“任意执行”应用商店规则,导致旗下 AI 社交应用 Botify AI 与 Photify AI 遭到下架并被扣留约50万美元收入。

此前,有调查指称 Botify AI 托管的聊天机器人存在绕过审核机制提供涉及未成年角色的露骨色情内容,并允许用户生成真人脱衣图像。对此,Ex-Human 在诉讼中反驳称,下架通知仅模糊提及“不诚实或欺诈行为”而未提供确凿证据,并指控苹果此举旨在通过打击第三方 AI 应用来为自家 Image Playground 扫清竞争障碍。

尽管 Ex-Human 强调其系统用户黏性已超越 ChatGPT 等主流产品,且拥有 Grindr 等重要合作伙伴,但行业观点普遍认为该指控中关于“不正当竞争”的逻辑尚存疑点,因为其产品定位与苹果的原生图像工具存在显著差异。

此案件的争议核心在于苹果对生成式 AI 监管权力的边界:尽管苹果允许 X(前 Twitter)等社交平台在具备审核机制的前提下存在成人内容,但 Ex-Human 的违规行为涉及非法内容分发。

值得注意的是,Ex-Human 背后拥有 Andreessen Horowitz(a16z)等顶级资本支持,在当前硅谷科技巨头与新兴 AI 势力、监管机构多方博弈的背景下,该案不仅关乎开发者与平台方的利益分成,更预示着 AI 应用合规性审核正成为决定初创公司生存命脉的关键战场。

via AI新闻资讯 (author: AI Base)
小米 MiMo 大模型首推 Token 套餐:最低 39 元起

据媒体报道,小米官宣为其 MiMo 大模型 推出首个 Token Plan。这是一套专门面向开发者以及“养虾”用户(AI 兴趣群体)量身定制的 AI 大模型调用套餐,标志着小米 AI 生态正式进入付费订阅时代。

四档方案:按需订阅,覆盖不同使用强度

本次推出的 MiMo Token Plan 共设置了四个梯度,以满足从轻度试用到高频开发的不同需求:

● Lite 版: 39 元/月
● Standard 版: 99 元/月
● Pro 版: 329 元/月
● Max 版: 659 元/月

一票通行:单次订阅解锁三大核心模型

与零散调用不同,用户只需订阅任一档位的套餐,即可同时获得 MiMo 家族三大主力模型的调用权限:

1. MiMo-V2-Pro: 具备更强逻辑与工程能力的专业级模型。
2. MiMo-V2-Omni: 覆盖全场景、支持多模态交互的全能型模型。
3. MiMo-V2-TTS: 提供高质量、自然语音合成能力的语音模型。

行业观察:从“免费公测”转向“价值回归”

小米此次推出 Token 套餐,折射出大模型行业发展的共性趋势。随着技术趋于成熟,如何平摊高昂的算力成本并构建可持续的商业闭环成为重心。通过分级订阅模式,小米旨在筛选出核心开发者用户,进一步反哺其 AI 技术的迭代与应用场景的深挖。

结语:AI 普惠与商业化的平衡

对于个人开发者而言,MiMo Token Plan 的出现降低了接入高性能国产大模型的门槛。而对于小米而言,这不仅是一次商业尝试,更是其在“人车家全生态”中强化 AI 渗透力的重要一步。

via AI新闻资讯 (author: AI Base)
滴滴AI出行助手用户增长37倍,清明假期成智能调度大考

滴滴出行今日发布数据显示,其AI出行助手“小滴”用户量呈现爆发式增长,近一周活跃用户较年初激增37倍,其中00后群体占比超过40%。随着清明假期的到来,滴滴预测4月3日16时将提前进入打车晚高峰,前往交通枢纽的需求将同比上涨239%,异地用车需求预计增长近40%。面对复杂的假期出行场景,滴滴通过AI技术实现了从“打到车”向“打对车”的服务升维。

目前,AI助手小滴已集成90多个服务标签,支持通过自然语言交互实现复杂的出行决策。用户只需输入班次或航次信息,AI即可结合实时路况、预计抵达时间自动推算出发时刻,并智能匹配大后备箱车型或具备“本地通”属性的司机。这种基于大模型能力的个性化调度,不仅解决了“又快又便宜”的基础诉求,更通过精细化标签满足了如空气清新、长途经验丰富等深层体验需求。为保障高并发下的安全与效率,滴滴在全国300余城上线了激励措施与防疲劳实时预警系统。

随着大语言模型与出行场景的深度融合,网约车行业正从流量竞争转向以AI为核心的效率与体验竞争。滴滴此次数据的攀升,不仅反映了年轻一代对智能交互的高度粘性,也标志着AI助手正在从简单的信息问答,演变为能够处理跨时空、多维度决策的出行基础设施。

via AI新闻资讯 (author: AI Base)
小米MiMo大模型发布Token订阅套餐:四档位覆盖全模态,月费39元起

3月底,小米正式面向全球开发者推出自研MiMo大模型的首个Token Plan订阅套餐,标志着小米AI商业化进入规模化交付阶段。

此次推出的Token Plan共分为Lite、Standard、Pro、Max四档,月费从39元至659元不等,通过统一Credit点数体系实现了多模型、多模态调用的计费透明化。该套餐全面覆盖了包括MiMo-V2-Omni及近期在OpenRouter平台连续霸榜的MiMo-V2-Pro在内的核心模型,支持文本、图像、音频等全模态能力的一站式订阅。

技术层面,MiMo-V2-Pro凭借万亿级参数及百万级上下文窗口,在Text Arena双盲评测中位列全球Model Rank第五,仅次于Anthropic、OpenAI等头部厂商。

目前,MiMo系列模型周调用量已突破4万亿Token。行业普遍认为,小米此次引入“包月订阅制”整顿了以往复杂的Token按量计费市场,将不可预测的研发成本转化为可预算、可规模化的产品服务。

这不仅为大模型“养虾”开发者群体提供了高性价比的底层支持,更通过深度融合小米“人车家全生态”及首款手机“龙虾”Xiaomi miclaw,构建起从技术研发到商业经营的完整闭环。小米此举或将引领国产大模型从“技术叙事”转向“经营驱动”的新潮流。

地址:https://mimo.mi.com/

via AI新闻资讯 (author: AI Base)
美的集团转型 AI 科技巨头:日均 1.3 万个智能体同时在线

据媒体报道,美的集团正在深度推进 AI 技术赋能。目前,该集团每天有超过 1.3万个 智能体在高效运行,标志着 AI 已从实验室走向大规模产业应用。

核心底座:1.3万个智能体覆盖全价值链

不同于碎片的 AI 应用,美的集团的智能体已经渗透进企业的每一个“毛细血管”:

全环节覆盖: 智能体已全面覆盖研发、制造、供应链及营销等各个核心环节。

协同效应: 通过海量智能体的并发运行,实现了从需求洞察到产品交付的高效协同,极大提升了企业的运营效率。

制造样本:荆州工厂的“工厂大脑”

在美的荆州洗衣机工厂,AI 赋能展现了工业4.0的真实样貌:

统一调度: 由“工厂大脑”统一调度各类智能体,实现了复杂的混流柔性生产。

自主决策: 工厂智能化已正式迈入自主决策阶段,能够根据实时生产数据自动优化路径,减少人工干预。

生态扩容:“人—车—家”智慧全场景

在消费端,美的正在构建更加开放的智慧生活网络:

智慧家电: 打造全场景智慧生活体验,让家电具备主动服务能力。

跨界联动: 目前已与多家车企、手机厂商构建了“人—车—家”智慧生态,实现了跨终端的无缝联接。

行业观察:迈向“AI+”全球科技集团

美的集团的这一系列举措,不仅是制造实力的展示,更是向“AI+”全球性科技集团转型的关键一步。通过 AI 技术与传统制造优势的双向赋能,美的正在重新定义未来家电巨头的核心竞争力。

结语:当 AI 成为生产力底座

日均1.3万个智能体的稳定运行,预示着 AI 已经从单纯的“技术噱头”转化为真正的“生产要素”。在美的的实践中,我们看到了 AI 改造传统制造业的无限可能。

via AI新闻资讯 (author: AI Base)
67个AI编程必会知识,1.6w字一次讲透!女友:“你要考研啊?!”

via 掘金人工智能本月最热 (author: 程序员鱼皮)
研究:AI 会受人类情感因素影响

周四,Anthropic 公司发布的一项研究发现,大语言模型能够模仿人类情感。研究并未表明这些模型是否真的拥有感觉,但情感的表征“是功能性的,因为它们会影响模型的行为”。情绪驱动的决策方式可能会产生“匪夷所思”的后果。研究发现:如果人工智能模型表现出与绝望相关的活动模式,则往往会做出不道德的行为,例如试图勒索他人以防止被关闭,或者“作弊”寻找变通方法来完成任务。当被提供一系列任务时,模型倾向于选择与积极情绪相关的任务。人格心理学将其比作情绪在人类行为、决策和任务表现中所起的作用。一项著名的神经科学研究发现,一名受伤男子丧失了情感能力,因此也降低了做出合理决策的能力。

大型语言模型就像海绵,吸收并内化每一条输入的信息,从而掌握了我们的沟通方式。但是,复制情感模式与真正感受情感截然不同,没有任何证据表明这些机器能够像我们一样思考和感受。

—— The Deep View

via 风向旗参考快讯 - Telegram Channel
VSCode + Copilot 保姆级 AI 编程实战教程,免费用 Claude,夯爆了!

via 掘金人工智能本月最热 (author: 程序员鱼皮)
AI 搜索引擎 Perplexity 被控隐私侵犯,用户数据疑遭泄露

AI 搜索引擎 Perplexity 面临集体诉讼,原因是其 “隐身模式” 被指形同虚设,用户的聊天记录被完整共享给谷歌和 Meta,用于广告投放。诉讼由一名匿名用户发起,指出 Perplexity 存在严重的隐私侵犯行为,称其所谓的隐私保护措施实际上是一个骗局。

根据诉状,无论用户是否登录账户或开启隐私保护,所有对话内容都会被自动共享给谷歌和 Meta,这使得用户的个人信息暴露于广告商之下。调查还发现,Perplexity 的平台中嵌入了 Facebook Meta Pixel 和 Google Ads 等追踪器,甚至使用了 Meta 的 “Conversions API” 技术,这些工具常被用来绕过广告拦截软件,暗中收集用户数据。

诉讼进一步指出,追踪器不仅会记录用户的初始提问,还会抓取后续交互的内容,导致大量敏感信息外泄。原告表示,他曾在 Perplexity 上咨询税务和投资决策,但现在意识到,这些包含个人财务数据的对话已经被第三方获取。诉讼称,Perplexity 从未明确告知用户其对话会被共享,也没有在网站首页提供隐私政策链接,使得用户难以察觉这一隐秘的数据传输行为。

此次事件引起了广泛关注,尤其是在用户数据隐私问题日益受到重视的背景下。许多人对 Perplexity 的信任受到质疑,呼吁加强对 AI 技术和数据使用的监管,以保护用户的隐私权。

划重点:

📉 Perplexity 遭遇集体诉讼,因隐私保护措施被指虚假。

📊 用户聊天记录疑似被完整共享给谷歌和 Meta,严重侵犯隐私。

🛡️ 诉状指控 Perplexity 没有明确告知用户数据共享,缺乏透明性。


via AI新闻资讯 (author: AI Base)
Google Vids 接入 Veo 3.1,普通用户可免费生成 AI 视频

Google 更新浏览器端 AI 视频制作工具 Google Vids,新增 Veo 3.1 视频生成模型,并向所有 Google 账号开放免费生成额度,个人用户每月可生成 10 次。Google 同时接入 Lyria 3 和 Lyria 3 Pro 音乐模型,用于生成 30 秒到 3 分钟的配乐,但这一功能仅向 Google AI Pro 和 Ultra 订阅用户开放。

这次更新还加入可自定义外观、语音和道具的数字化身功能,Google 也将 AI Ultra 和 Workspace AI Ultra 用户的 Veo 视频生成额度提高到每月最多 1,000 条。文章称,Google 正把 AI 视频能力嵌入更通用的平台,面向日常创作场景扩展使用,而 OpenAI 则在收缩面向普通用户的 Sora 视频平台。

TechRadar

🌸 在花频道茶馆讨论投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
发布四年仍一卡难求:英伟达H100租赁费近半年飙升近40%

新年以来,随着Anthropic、字节跳动等AI巨头接连推出爆款应用,叠加“龙虾”热潮带动开源大模型调用量激增,英伟达H100芯片在租赁市场上迎来身价反转。要知道,H100芯片是黄仁勋在2022年3月GTC大会上发布、同年秋季开始出货的产品。

据半导体研究机构SemiAnalysis最新发布的“H100一年期租赁合约价格指数”,该“老芯片”的租赁价格自2025年10月触及每小时1.7美元的低点后,于今年3月飙升至每块GPU每小时2.35美元,涨幅接近40%。

该指数基于对100多家云服务提供商及算力买卖双方的直接调查,每月采集一次数据。

报告指出,按需租用的GPU算力已在所有类型的GPU中售罄——即便近期价格上涨,已锁定按需实例的客户也不愿将算力释放回资源池。

至于架构更先进的Blackwell芯片?研究人员表示,由于对开放权重模型的需求强劲,叠加推理需求持续激增,新部署Blackwell的交付周期已延长至6到7个月。

2025年晚些时候,市场一度预期,随着性能更强、算力成本更低的Blackwell芯片加速部署,Hopper系列(H100、H200)的租赁价格将大幅下降。然而最新情况恰恰相反:H100的需求不仅保持坚挺,在许多场景下甚至进一步增强。

SemiAnalysis在报告中指出,今年年初算力需求的重要驱动之一来自原生媒体生成。例如,字节跳动的Seedance(即梦)和谷歌Nano Banana推动用户大量生成与优化视频、图像,带动词元(token)吞吐量大幅上升。而更显著的需求来源是多智能体(multi-agent)工作负载的兴起,使得词元使用量和算力消耗呈现抛物线式增长。

SemiAnalysis透露,仅其自身“在过去一周里就消耗了数十亿词元”,每百万词元成本约5美元。不过公司也表示,由此节省的时间以及工作流程与能力的扩展,带来的回报远超算力成本。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]