https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
马斯克再放豪言:特斯拉人形机器人可在宜居星球独立建立文明

特斯拉官方账号 @TeslaAI 今日发布了一条引发科技圈热震的消息:特斯拉人形机器人(Optimus)将具备在任何宜居星球上独立建立文明的能力。这一表态不仅展示了特斯拉对具身智能技术的极度自信,也再次呼应了马斯克对于多星球栖息的宏大愿景。

目前,特斯拉人形机器人正处于高速迭代阶段。据官方透露,第三代特斯拉人形机器人即将正式亮相,其核心突破在于强大的自主学习能力——机器人仅需通过观察人类的行为即可掌握新技能。为了实现规模化应用,特斯拉计划将年产量提升至百万台级别,旨在通过工业化量产大幅降低成本并加速场景落地。

事实上,Optimus 已经在现实场景中开始了“职业生涯”。去年7月,特斯拉首家“超级充电餐厅”试营业期间,该机器人便已上岗担任服务员,负责售卖爆米花等工作。与此同时,配合 Cybercab 无人驾驶出租车的协同运作,特斯拉正逐步构建一个由 AI 和自动化设备主导的新型生活与工作生态。

尽管部分网友对“建立星球文明”的说法持怀疑态度,但随着 AI 大模型与机械硬件的深度融合,特斯拉正试图证明:机器人将不再仅仅是工厂里的劳动力,而是未来人类探索宇宙疆域的关键伙伴。

via AI新闻资讯 (author: AI Base)
谷歌财报炸裂!年收破4000亿,AI狂飙Gemini用户直追ChatGPT

在人工智能浪潮的推动下,谷歌母公司Alphabet发布了令人瞩目的财报数据,展现出科技巨头在AI领域的强劲势头。以下是基于最新信息的整理与分析,揭示谷歌如何通过创新实现跨越式增长。

 营收创历史新高

谷歌年收入首次突破4000亿美元大关,达到4028亿美元。这一里程碑式成就标志着公司在全球科技市场的领先地位得到进一步巩固。相较以往,这一增长不仅体现在规模上,更反映出高效的运营策略和市场扩张。

 Gemini应用表现亮眼

Gemini App的月活跃用户已超过7.5亿,与ChatGPT的8亿月活跃用户相差无几,显示出谷歌在AI聊天工具领域的快速追赶。此外,付费订阅用户超过3.25亿,而Gemini Enterprise在上线上线仅四个月内,已售出超过800万个付费席位。这表明企业级AI解决方案正成为谷歌新的增长引擎,满足了全球用户对智能工具的需求。

 Q4业务线强劲增长

第四季度各业务线均表现出色:搜索业务加速增长17%,YouTube收入突破600亿美元大关。Google Cloud收入增长高达48%,年化运营收入超过700亿美元,云服务积压订单环比增长55%,达到2400亿美元。几乎所有业务线都在加速发展,而非放缓,这在年收入已达4000亿美元的科技巨头中实属罕见。

 AI驱动增量增长

这些数据凸显AI不仅仅是替代现有业务,而是真正驱动增量价值的引擎。在多家科技公司面临增长瓶颈之际,谷歌的多条业务线实现两位数甚至接近50%的增长,证明了AI技术的战略性作用。这不仅提升了公司竞争力,也为行业提供了宝贵借鉴。

 未来资本支出展望

Alphabet预计2026年资本支出将在1750亿至1850亿美元之间,这一规模已超过许多国家的年度GDP,体现了公司对基础设施和AI研发的巨额投入。未来,谷歌将继续加大在数据中心、AI硬件等方面的布局,以支撑持续创新。

谷歌的这份财报不仅是数字上的胜利,更是AI时代下科技企业转型的典范。面对竞争激烈的市场,谷歌通过Gemini等产品证明了其在AI领域的深厚积累。

via AI新闻资讯 (author: AI Base)
延迟低于 0.2 秒!Mistral AI 发布 Voxtral Transcribe 2 语音模型,支持中文实时转录

法国人工智能初创公司Mistral AI近日宣布推出全新的语音转文字模型系列——Voxtral Transcribe2。这一系列包含两款针对不同应用场景优化的模型,旨在解决语音交互中的高延迟和成本痛点。

其中,最受关注的是名为 Voxtral Realtime 的实时转录模型。该模型拥有4B(40亿)参数规模,采用创新的流式架构。其核心亮点在于极致的响应速度:模型可以在音频输入的瞬间同步进行转录,官方数据显示其转录延迟已被压缩至200ms(0.2秒)以下。这意味着在实时对话或同声传译场景中,用户几乎感受不到处理停顿。为了促进开发者社区的生态建设,Mistral AI已以 Apache2.0协议正式开放了该模型的权重。

另一款模型 Voxtral Mini Transcribe V2 则主打大批量处理与极高性价比。该模型专门为处理长音频设计,单次请求即可支持长达3小时的录音文件。在准确率表现上,Mistral 官方表示该模型已超越了 GPT-4o mini Transcribe 和 Gemini2.5Flash。

在语言支持与成本方面,两款新模型均具备出色的普适性,支持包括中文在内的13种主流语言。定价策略也十分具有竞争力:离线批处理版 API 价格为每分钟0.003美元,而追求极致性能的实时版 API 价格则为每分钟0.006美元。

划重点:

极低延迟: Voxtral Realtime 模型将转录延迟降至200ms 以内,支持音频即时转录,且已开源模型权重。
🏆 高性价比: Voxtral Mini 版在准确率上优于 GPT-4o mini 等同类产品,支持3小时超长录音,价格极具优势。
🌐 多语支持: 全系列模型原生支持中文等13种语言,广泛适配全球化的语音办公与实时交互场景。

via AI新闻资讯 (author: AI Base)
我国生成式 AI 用户规模破 6 亿:普及率超四成,算力水平跃居全球前列

随着人工智能技术的爆发式增长,我国生成式人工智能(AIGC)的普及速度正超出外界预期。根据 2 月 5 日上午发布的第 57 次《中国互联网络发展状况统计报告》(以下简称《报告》)显示,截至 2025 年 12 月,我国生成式人工智能用户规模已达 6.02 亿人。

这一数据相较于 2024 年底实现了惊人的增长,增幅高达 141.7%。与此同时,生成式 AI 的普及率也从过去的低位攀升至 42.8%,大幅提高了 25.2 个百分点。这意味着在我国网民群体中,近乎每两人中就有一人正在使用生成式 AI 产品,该技术已从少数人的“尝鲜”工具快速转变为大众化的生产力武器。

在应用层面,生成式人工智能正加速渗透进居民的日常生活与生产各环节。无论是办公辅助、创意设计,还是智能交互,AIGC 正在成为推动全社会数字化、智能化转型的关键引擎。这种爆发式的用户增长,也对底层基础设施提出了更高要求。

为了支撑 AI 产业的飞速发展,我国在算力设施建设上也交出了亮眼的成绩单。目前,全国已建成万卡级别的智算集群共 42 个,整体智能算力规模超过 1590 EFLOPS。这一算力水平不仅有力保障了国内大模型的迭代与应用,也让我国的智能算力规模稳居全球前列。

随着“十四五”规划进入收官阶段,我国互联网在技术创新与覆盖广度上均取得了长足进步。展望未来,相关部门表示将继续坚持技术创新与惠民并重,进一步强化互联网在服务中国式现代化建设中的支撑作用。

划重点:

📈 用户猛增: 我国生成式人工智能用户规模已达 6.02 亿,较 2024 年底增长 141.7%,普及率达到 42.8%。
💻 算力支撑: 全国已建成 42 个万卡智算集群,智能算力总规模超过 1590 EFLOPS,位居全球前列。
🚀 深度融合: 生成式 AI 正加速融入日常生活与生产,成为数字化转型及经济高质量发展的重要引擎。

via AI新闻资讯 (author: AI Base)
奥尔特曼发长文回应Anthropic超级碗广告

Anthropic此前宣布,将不会在其AI聊天机器人Claude中引入广告。为了进一步强调这一立场,该公司还发布了一条超级碗广告,讽刺竞争对手在其AI产品中加入广告,但没有点名。OpenAI首席执行官奥尔特曼周三在 X 发表长文,回应了 Anthropic 的嘲讽。他写道:“我们最重要的广告原则规定,我们绝不会做这种事;我们显然永远不会以Anthropic描述的那种方式运行广告。我们并不傻,我们知道我们的用户会拒绝那种做法。”奥尔特曼反驳称,这些广告完全符合Anthropic惯用的双言巧语。他还讽刺称,Anthropic的AI是卖给富人的昂贵产品……而我们需要将人工智能带给数十亿无法支付订阅费用的人。

—— Theverge财联社

via 风向旗参考快讯 - Telegram Channel
社交新物种 Moltbook 走红:AI 主导的“数字化社区”开启千亿商机

2026年伊始,一款名为 Moltbook 的 AI 社交网络以其独特的交互逻辑迅速在科技圈“出圈”。这款被戏称为“人类旁观、AI 主导”的新型社交平台,正在以颠覆性的姿态开启 AI 社交商业化的新纪元。

“硅基社交”的爆炸式增长

Moltbook的走红并非偶然,其背后的数据增长令人惊叹:

用户激增:上线仅一周时间,便吸引了超过100万 个 AI 智能体入驻。

活跃度惊人:平台日均发帖量迅速突破万条,形成了一个完全由 AI 自发组织、自我进化的动态社区。

技术基石:该平台由开发者马特·施利希特(Matt Schlicht)基于开源 AI 智能体项目 OpenClaw 精心打造。

颠覆传统:AI 才是这里的主角

与传统社交平台不同,Moltbook创造了一种全新的自组织功能:

自发进化:平台上的智能体会根据特定的算法规则进行深度社交,人类用户更多扮演的是“观察者”角色。

商业潜力:财经专家预测,这种模式预示着 AI 社交市场将迎来千亿级的发展机遇。

市场规模:预计到2026年底,AI 社交市场规模有望突破300亿元,成为推动 AI 产业增长的核心引擎。

巨头入场与资本狂欢

Moltbook的爆火在资本市场激起了千层浪:

股价波动:受此利好提振,AI 社交产业链相关公司的股价近期表现活跃,呈现普涨态势。

全球布局:科技巨头如 OpenAI、谷歌、Meta 等已敏锐察觉到这一趋势,正加速在 AI 社交领域的战略布局。

融资热潮:目前,该赛道已吸引了海量投融资,新一轮的社交技术变革已然拉开帷幕。

via AI新闻资讯 (author: AI Base)
用层已死?美图吴欣鸿:深耕高价值垂直场景,应用与大模型共生

近期“大模型吞噬应用”的言论引发市场担忧。美图公司 CEO 吴欣鸿在年会上对此回应称,通用大模型与垂直应用之间更多是协同效应而非单纯竞争。

吴欣鸿将大模型比作“瑞士军刀”,虽能胜任通用任务,但在垂直场景效率有限;而应用则是“专业刀具”,能精准解决刚需。他指出,应用层的护城河在于对高价值垂直场景的深度挖掘,解决“最后一公里”的长尾需求并占据用户心智。

他强调,目前通用大模型的对话式交互存在局限,且难以覆盖行业 SOP、高精度编辑等专业领域。美图将致力于打造垂直场景的影像应用平台,通过专业工具释放大模型能力。

via AI新闻资讯 (author: AI Base)
奥运史首创!米兰冬奥宣布启用阿里“千问”官方大模型

2026年2月5日,奥林匹克运动迎来里程碑式的科技飞跃。国际奥委会主席考文垂正式对外宣布:基于阿里千问打造的奥运史上首个官方大模型已问世,并确定将在米兰冬奥会上正式投入使用。

从“云上转播”到“智能奥运”的跨越

这一动作不仅是一次技术升级,更标志着奥运科技正式迈向全新纪元:

核心支撑:该大模型深度集成阿里千问的底层能力,旨在为赛事提供全方位智能支持。

战略意义:国际奥委会主席考文垂强调,这意味着奥运会已从传统的数字化转播,彻底跨入以大模型为驱动的“智能奥运”阶段。

实战演练:米兰冬奥会将作为首个应用场景,全面检验大模型在赛事管理、观众互动及多语种服务等方面的表现。

科技大厂加速布局春节档

在冬奥大动作之外,国内互联网巨头也在激烈的“春晚战场”加速博弈:

B站与春晚深度合作:B站已官宣与总台春晚达成战略合作,将在直播期间开放极具特色的“真弹幕”互动功能。

技术加码体验:为确保互动流畅,B站方面承诺今年将大幅增加技术投入,力求弹幕体验同比去年实现显著提升。

业内认为,无论是奥运会的智能化转型,还是春晚互动方式的革新,都折射出2026年 AI 正在深度重塑全球顶级 IP 的商业逻辑与用户体验。

via AI新闻资讯 (author: AI Base)
编程界的“大一统”?GitHub 集成 Claude 与 Codex,开启多模型协作新纪元

微软旗下的全球开发者社区 GitHub 再次投下“重磅炸弹”。今日,GitHub 正式宣布在其平台内深度集成 Anthropic 旗下的 Claude 以及 OpenAI 的 Codex 人工智能编程智能体。这一动作标志着 GitHub 正在从单一模型辅助工具,转型为支持多模型协同开发的“智能体总部”(Agent HQ)。

本次更新已面向 GitHub Copilot Pro Plus 与 Enterprise 订阅用户开放公开预览。开发者现在无需在不同的网页或应用间反复横跳,便可在 GitHub 网页端、移动版以及程序员们离不开的 Visual Studio Code 编辑器中,自由切换并调用不同的 AI 智能体。这种“多机位”的开发模式,让开发者能够针对不同的编程任务,选择最擅长处理该领域的 AI 助手。

GitHub 首席产品官马里奥·罗德里格斯指出,开发过程中的“上下文切换”往往是效率的最大杀手。通过这次集成,开发者可以在不丢失代码背景信息的前提下,对比 Copilot、Claude 和 Codex 生成的解决方案。比如,你可以让 Claude 构思业务逻辑,再由 Codex 负责代码的落地实现。这种“竞争上岗”的机制,不仅提升了代码质量,更赋予了开发者前所未有的自主权。

值得关注的是,GitHub 并没有止步于此。除了目前已经接入的模型,官方透露正与谷歌、Cognition 以及 xAI 展开紧密合作,未来将有更多顶尖的 AI 编程智能体进驻 GitHub 生态。这种兼容并蓄的策略,无疑将进一步巩固 GitHub 在 AI 编程时代的霸主地位。

划重点:

🤖 多模态自由切换:GitHub 官方集成 Claude 与 Codex,支持开发者在网页、手机和 IDE 中根据任务需求自主选择最合适的 AI 智能体。
消除开发摩擦力:通过“智能体总部”战略,实现跨模型协作无需切换工具或重新输入上下文,显著提升复杂编程任务的连贯性。
📈 生态矩阵持续扩大:微软正引入更多竞争对手的 AI 模型进行对比测试,未来还将接入谷歌和 xAI 的智能体,打造全开放的 AI 编程环境。

via AI新闻资讯 (author: AI Base)
OpenAI 组建“地推”大军:扩招数百名部署工程师,志在吞下企业级市场

为了在竞争激烈的企业 AI 赛道筑起护城河,OpenAI近期开启了大规模的人才扩张计划。据 The Information 报道,OpenAI正计划为其咨询团队招聘数百名**“前沿部署工程师”**(Frontier Deployment Engineers),旨在通过更深度的定制化服务,赢取大型企业的核心业务订单。

从“工具提供者”向“解决方案商”转型

这一招聘动作释放了一个明确信号:OpenAI不再满足于仅仅提供 API 接口,而是要深入企业腹地。

深度定制化:这些部署工程师将直接与大型企业对接,协助其将 AI 模型嵌入复杂的业务流程中。

咨询团队扩容:招聘规模达数百人,显示出OpenAI正在组建一支能够提供全方位技术咨询与落地支持的“地推”精锐。

抢占商业先机:通过提供专业化部署,OpenAI试图以此建立更高的客户粘性,在企业级市场确立主导地位。

步步为营:OpenAI 的企业级版图

回顾过去几月的动作,OpenAI的每一步都在为大规模商业化铺路:

工具赋能:此前已发布战略级AgentKit工具套件,降低企业开发智能体的门槛。

人才掠夺:从特斯拉、Meta 等科技巨头频频挖角顶尖工程师,持续强化技术团队。

生态布局:通过入股Thrive Holdings等举措,加速 AI 在医疗等垂直领域的普及。

市场观察:AI 巨头的“下沉”战事

随着基础模型能力的趋同,2026年的 AI 竞赛已进入“落地为王”的阶段。OpenAI此次组建庞大的部署工程师团队,本质上是在补齐其在 B 端服务上的短板,直接挑战传统软件巨头与咨询公司的领地。

via AI新闻资讯 (author: AI Base)
OpenAI组建广告诚信团队 护航ChatGPT广告业务落地

2月5日消息,据Business Insider报道,OpenAI近日通过招聘启事宣布组建广告诚信专项团队,为即将启动的ChatGPT广告业务筑牢安全防线,保障用户信任与商业合规并行。

据1月下旬发布的招聘信息显示,该团队属于科技行业常见的"0→1"初创团队,核心职责包括设计广告安全保障系统、开发客户身份验证(KYC)系统,以及制定广告展示位置与展示方式规则。其中,客户身份验证系统将用于核实广告商身份、评估风险等级,是防范诈骗广告及有害内容的关键风控手段;而广告展示规则的制定,将在扩大广告业务规模的同时,维系用户对ChatGPT原生回答内容的信任。

对于科技巨头的大规模广告业务而言,组建专项团队打击广告欺诈、保障品牌安全已是行业常规做法。此前OpenAI已确认,将在美国地区的ChatGPT免费版及基础订阅版中开展小规模广告测试,用户未来几周内即可看到相关广告。参与测试的广告主需最低投入20万美元(约合138.9万元人民币),OpenAI将统计广告点击量和曝光量,并探索更多效果衡量方式。

目前,OpenAI发言人已证实上述广告测试相关安排,但对于广告诚信岗位招聘事宜未予进一步置评。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球科技)
被AI对手暗讽给ChatGPT加广告 奥特曼回应:咱不是一个量级

2月5日,据科技网站TheVerge报道,萨姆·奥特曼(Sam Altman)周三回应了对手Anthropic暗讽OpenAI给ChatGPT加广告一事。他表示,Anthropic的广告宣传“明显不诚实”,而且ChatGPT用户量远超Anthropic,双方面临的是不同维度的问题。

Anthropic此前宣布,将不会在其AI聊天机器人Claude中引入广告。为了进一步强调这一立场,该公司还发布了一条超级碗广告,讽刺竞争对手在其AI产品中加入广告,但没有点名。OpenAI已确认,将尝试在ChatGPT中投放广告。

奥特曼周三在X发表长文,回应了Anthropic的嘲讽。“首先,说说Anthropic广告的优点:它很有趣,我笑了。但我不理解Anthropic为何要采用如此明显不诚实的手法。我们关于广告最重要的原则明确禁止这类做法。我们显然永远不会以Anthropic描绘的方式投放广告。我们并不愚蠢,也知道用户会拒绝那种方式。”奥特曼称。

奥特曼的回应

他还承诺,将会免费提供ChatGPT。“更重要的是,我们认为每个人都应有机会使用AI,并致力于提供免费访问,因为我们相信访问权能带来自主性。在得州,使用ChatGPT免费版的人数多于全美使用Claude的人数,所以我们面临的是不同维度的问题。(如果你愿意付费使用ChatGPT Plus或Pro,我们就不会向你展示广告)。”奥特曼称。

Anthropic为富裕群体提供昂贵的产品。我们乐见其成,自身也在开展此类服务,但我们同样坚信,必须将AI技术带给数十亿无力承担订阅费用的普通大众。”奥特曼表示。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:凤凰网科技)
四个月跨越四个千亿级台阶:SpaceX与xAI合并助马斯克再创财富神话

马斯克的财富狂飙始于2025年秋季。随着特斯拉股价在10月份迎来强劲飙升,他的个人净资产顺势突破了5000亿美元大关。这一纪录不仅稳固了他的全球首富地位,也让他成为了人类历史上首位跨入“5000亿俱乐部”的超级富豪。

进入12月,马斯克的财富增长动力切换到了航天赛道。12月15日,SpaceX 的公司估值从8月份的4000亿美元惊人地跃升至8000亿美元。受此资产价值重估的影响,马斯克的净资产在短短两个月内再次跨越重磅门槛,成为全球首位财富突破6000亿美元的人。

在身价刚破6000亿的几天后,法律层面的转机为其财富锦上添花。特拉华州最高法院宣布恢复了马斯克此前在2024年被下级法院撤销的特斯拉股票期权。这一关键性判决让他的资产再次迎来跨越式增长,使其个人财富迅速挺进7000亿美元大关。

财富的最终爆发源于 SpaceX 与 xAI 的战略合并。据《福布斯》估算,这笔合并交易直接为马斯克增色840亿美元资产。至此,马斯克的身价达到了创纪录的8520亿美元,正式成为史上首位身价突破8000亿美元的富豪,在四个月内完成了连续跨越四个千亿级台阶的壮举。

via AI新闻资讯 (author: AI Base)
阿里AI战略再升级:大模型品牌正式更名为“千问”

2026年2月5日,阿里巴巴集团宣布了一项重大的品牌整合计划:将旗下AI技术的总称及核心品牌全面统一为**“千问”**。这一举措旨在消除过往多品牌并存带来的市场认知混淆,标志着阿里在AI领域的品牌传播进入了高度聚焦的新阶段。

品牌统一:告别名称乱象

在此次调整之前,阿里巴巴的大模型曾使用过“通义千问”、“千问”、“Qwen”等多个称谓,这在一定程度上影响了用户对品牌的一致性感知。

统一称呼:今后,阿里巴巴大模型品牌的中文官方名称统一为**“千问大模型”**。

英文标识:全球范围内统一使用英文名称 Qwen。

范围覆盖:该品牌将涵盖从底层基础大模型到各行业的专业领域模型。

组织划分:通义实验室定位明确

在明确品牌名称的同时,阿里巴巴也厘清了组织架构的命名规范:

组织定位:**“通义实验室”**将作为阿里巴巴集团旗下的研究机构名称继续使用。

技术输出:该实验室将继续负责千问大模型的核心技术研发与演进。

同场速报:SpaceX 百万卫星系统获 FCC 受理

在阿里巴巴整合品牌的同时,航天领域也传来了重磅消息。当地时间2月4日,美国联邦通信委员会(FCC)正式受理了SpaceX提交的关于部署一个包含100万颗卫星的新非地球静止轨道系统申请。

申请节点:该申请于2026年1月30日提交。

公众反馈:FCC目前已开始公开征求意见,截止日期为2026年3月6日。

通过此次品牌“瘦身”,千问大模型将以更清晰的姿态参与到全球 AI 市场的竞争中。

via AI新闻资讯 (author: AI Base)
算力能效比直逼 Rubin5倍?初创公司 Positron 发布 Asimov 架构重塑 AI 推理

在全球 AI 芯片竞赛持续升温的背景下,初创芯片公司 Positron 近日正式揭开了其全新 AI 推理芯片——Asimov 的神秘面纱。该公司宣称,这款针对大模型(LLM)推理深度优化的芯片,在能效比(每瓦 Token 数)和性价比(每美元 Token 数)这两个关键指标上,预计将达到英伟达下一代 Rubin 架构的5倍,这一激进的数据立刻引发了业内的广泛关注。

Positron 的核心逻辑在于对传统 GPU 架构的“减法”式重塑。Asimov 芯片舍弃了传统计算卡中庞杂的控制电路,转而采用一种更纯粹的张量处理架构,旨在最大限度地减少能量在非计算环节的损耗。这种设计思路不仅让 Asimov 在运行同等规模的模型时功耗更低,更极大地缩减了芯片的制造与封装成本。Positron 团队强调,面对当前数据中心严苛的电力限制,这种极致的能效表现将成为企业部署 AI 服务的关键。

尽管 Asimov 展现了惊人的理论数值,但要挑战英伟达的市场地位并非易事。目前,Positron 正致力于构建配套的编译器与开发生态,以确保开发者能够无缝迁移现有的 PyTorch 或 TensorFlow 模型。Asimov 芯片计划采用先进制程工艺,并针对当前主流的 Transformer 架构进行了硬件级加固,确保在处理万亿参数模型时依然能保持高吞吐量与低延迟。

AIbase 认为,Positron 的入局代表了 AI 芯片领域从“通用算力”向“专用推理”转型的趋势。如果 Asimov 能够如期兑现其5倍效能的承诺,将可能彻底改写大模型推理市场的成本版图。

划重点:

🚀 能效巅峰挑战:Asimov 芯片宣称其每瓦特及每美元产出的 Token 效率是英伟达未来 Rubin 架构的5倍,主打极致性价比。
🏗️ 架构精简革新:舍弃通用计算的冗余设计,通过专注于张量计算的专用架构,大幅降低推理过程中的能量损耗与硬件成本。
🌐 瞄准大规模推理:硬件设计针对 Transformer 架构深度优化,旨在解决万亿参数模型部署时的电力瓶颈与高昂的运营费用。

via AI新闻资讯 (author: AI Base)
可灵 AI 3.0 正式上线:多模态创作门槛再降,电影级叙事全面普及

国内顶尖视频生成模型可灵 AI(Kling AI)今日宣布正式迈入3.0时代。本次更新并非简单的参数迭代,而是针对视频与图片生成能力进行了一次从底层逻辑到应用工具的全维度升级。新版本核心围绕叙事能力、画面可控性及多模态协同展开,旨在为专业创作者和大众用户提供更为丝滑的“原生”创作体验。

在视频生成领域,可灵3.0引入了极具突破性的“智能分镜”功能。以往 AI 视频往往受限于单镜头表达,而新版本能够自动理解剧本需求,自主调度景别与机位,让 AI 生成的短片具备了更强的电影感。同时,图生视频能力也得到了质的提升,用户现在可以通过多张图片或视频片段作为主体参考,精准锁定角色形象和场景特征。此外,视频时长已扩展至3到15秒,配合多语种口型同步技术,使得复杂剧情的长镜头表现更加自然。

图像生成方面,图片3.0系列模型同样带来了惊喜。通过引入影视级的光影重构技术,模型能更精准地解析提示词中的视觉元素,输出原生2K 甚至4K 的高分辨率画质。针对协同创作需求,新版本支持最多10张参考图的融合,无论是色调统一还是风格转绘,用户都无需频繁切换功能即可一键完成。

目前,可灵 AI3.0的部分新特性已面向黑金会员开放超前体验。据官方透露,未来几个月内还将持续上线更多功能,进一步打通从灵感到成品的全链路 AI 创作流程。

划重点:

🎬 叙事能力重构:新增智能分镜与15秒长镜头支持,AI 能像导演一样自动调度机位与景别,降低了专业级视频的创作门槛。
🧬 一致性深度进化:支持多图/视频主体参考,精准锚定人物与道具特征,并实现多语种口型精准同步,提升角色表现力。
🖼️ 画质与流程升级:图片模型支持原生4K 输出及多图风格融合,并首创多模态一体化创作流,覆盖从生成到编辑的全链路。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]