https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
ChatGPT Agent 用户流失 75%,定位模糊成“致命伤”

在发布仅六个月后,OpenAI 旗下的 ChatGPT Agent 正面临被停用的危机。据最新报道显示,该产品的用户量已从高峰期的 400 万每周活跃付费用户,暴跌至不足 100 万,流失率高达 75%。

尽管在发布初期吸引了约 11% 的订阅用户尝试,但 ChatGPT Agent 很快就陷入了增长停滞。主要原因在于,大多数用户根本无法理解这个工具的实际用途,甚至有许多人压根不知道它的存在。此外,系统运行缓慢、可靠性欠佳以及潜在的网络安全风险,也进一步推离了用户。

“ChatGPT Agent”这个命名本身也被认为具有误导性。事实上,ChatGPT 的其他模式(如推理模型)已经具备了编写代码、网页浏览和图像分析等“智能体”特征。而该产品唯一的差异化功能仅在于“虚拟浏览器”,将其冠以“Agent”之名,反而让用户误以为其他功能不具备智能代理能力。

面对通用型智能体的失利,OpenAI 正在调整策略,转向开发功能更明确的专用智能体。例如,最新推出的“购物研究(Shopping Research)”智能体,专门用于产品推荐和搜索。

via AI新闻资讯 (author: AI Base)
警惕“裸奔”的开源AI:研究称脱离监管或成黑客劫持温床

近日,网络安全公司 SentinelOne 与 Censys 联合发布的一项深度研究揭示了开源大语言模型面临的严峻安全挑战。 研究指出,当这些模型脱离主流托管平台的“护栏”与安全限制,在外部私有计算机上独立运行时,极易沦为黑客与犯罪分子的攻击目标,产生严重的安全风险。

这项耗时近 300 天的研究发现,目前互联网上存在数千个缺乏保护的开源 AI 运行实例,其中包含大量基于 Meta 的 Llama 和谷歌的 Gemma 等主流模型开发的衍生版本。 尽管部分开源模型原生自带安全防线,但研究人员仍发现了数百起安全护栏被恶意移除的情况。

安全专家将这一现象形容为行业视野外的“冰山”:开源算力在支持合法用途的同时,正被明显用于犯罪活动。 攻击者可以通过劫持这些运行实例,强制模型生成大量垃圾信息、编写精准的钓鱼邮件,甚至发动大规模的虚假信息宣传。

研究团队重点分析了通过 Ollama 工具部署的开源实例。 令人担忧的是,在约 25% 的观察对象中,黑客可以直接读取模型的“系统提示词”——即决定模型行为的核心底层指令。 进一步分析显示,其中 7.5% 的指令已被修改,旨在为有害行为提供技术支持。

这种风险场景波及范围极广,包括但不限于仇恨言论传播、暴力内容生成、个人隐私数据窃取、金融诈骗,甚至是涉及儿童安全的内容。 由于这些模型绕开了大型平台的监控机制,传统的安全防护手段往往难以奏效。

via AI新闻资讯 (author: AI Base)
OpenAI 宣布停用 GPT-4o 等多款模型,用户转向新一代技术

OpenAI 正式宣布了一项重大的模型迭代计划:从下个月起,将从 ChatGPT 中停用包括 GPT-4o 在内的多款旧版大模型。这一决定标志着曾经备受好评的 GPT-4o 正式完成历史使命,走进技术博物馆。

GPT-4o 自2024年5月发布以来,凭借其亲切的对话风格和出色的多模态能力,赢得了一批忠实拥趸。然而,随着技术更迭,OpenAI 的重心已全面转向新一代旗舰模型。

优胜劣汰:GPT-5.2已成用户绝对首选

OpenAI 披露的数据显示,目前每天仅有0.1% 的用户仍在使用 GPT-4o。相比之下,绝大多数用户已经迁移到了性能更强、逻辑更缜密的 GPT-5.2模型上。官方表示,近几个月来,公司在模型的个性化、定制化以及创意构思能力方面取得了显著进步,现在正是停用旧模型的成熟时机。

清理名单:多款“mini”与推理模型同步退场

此次“大清洗”的范围不仅限于 GPT-4o。根据公告,GPT-4.1、GPT-4.1mini 以及 OpenAI o4-mini 也将被同步移出 ChatGPT 服务列表。此外,早前发布的 GPT-5Instant 和 GPT-5Thinking 同样在停用名单之列。

此前,当 OpenAI 尝试关闭 GPT-4o 访问权限时,曾因用户不满而一度恢复,CEO 萨姆·奥尔特曼当时承诺若要停用将提前通知。如今,随着 GPT-5系列模型的全面铺开,OpenAI 终于下定决心,通过精简模型库来集中算力资源,为用户提供更统一、更先进的 AI 交互体验。

您是否还想了解:

OpenAI 针对开发者开放的最新GPT-5.2-Codex API有哪些新特性?
传闻中即将发布的GPT-5.1三个版本分别针对哪些应用场景?
业界大佬杨立昆为何对GPT-5的数学能力提出公开批评?

via AI新闻资讯 (author: AI Base)
金山办公联手华为:深耕鸿蒙生态,升级 AI 办公新体验

北京金山办公软件股份有限公司与华为在珠海正式签署战略合作协议。双方将围绕个人消费者领域展开深度合作,致力于通过技术融合与生态共建,系统性地解决跨设备办公、AI 适配及效率提升等核心痛点。

核心目标:打造全球办公的“中国方案”

根据协议规划,双方的目标是到2026年,为国内用户提供更加安全、流畅且高效的 AI 办公体验。这一合作不仅旨在优化国内市场,更抱有为全球操作系统提供极具参考价值的“中国方案”的愿景。

合作亮点:WPS 鸿蒙版全面进化

双方的合作由来已久,并已在多个维度取得显著成果:

分布式架构优势:借助华为鸿蒙(HarmonyOS)的分布式架构,金山办公已成功推出 WPS 鸿蒙版,大幅提升了跨端办公的流畅度。

AI 功能深度升级:未来,双方将继续升级 WPS 鸿蒙版的 AI 功能,进一步释放个人办公的生产力。

全平台布局:自2025年以来,WPS 鸿蒙版在移动端和 PC 端均取得了显著进展,为2026年的全面 AI 升级奠定了坚实基础。

强强联合,共筑智慧办公未来

此次签约仪式由金山办公CEO 章庆元与华为终端 BG CEO 何刚共同出席。双方的强强联手,标志着国产软件与自研操作系统在 AI 时代的融合进入了新阶段,将共同推动办公场景向全场景、智能化方向加速演进。

via AI新闻资讯 (author: AI Base)
↩️ 苹果斥资近 20 亿美元收购 AI 初创公司 Q.ai


科技圈🎗在花频道📮:

🍏 苹果内部就收购Perplexity和Mistral AI存分歧,库克开放并购但高管意见不一 据The Information报道,尽管库克近期表示苹果"非常开放能加速路线图的并购",但公司仍告诉银行家将专注于AI领域的小规模交易。苹果内部对收购Perplexity和法国AI公司Mistral仍在讨论中,特别是在与谷歌的搜索协议面临法院裁决的背景下。 服务高级副总裁埃迪·库伊最支持大型AI收购,此前曾力推收购Netflix和特斯拉但均被库克否决。而软件工程高级副总裁克雷格·费德里吉则持谨慎态度,认为…

苹果斥资近 20 亿美元收购 AI 初创公司 Q.ai

苹果公司以约 20 亿美元收购 AI 初创公司 Q.ai,系其史上规模第二大的收购案。 Q.ai 专注于成像与机器学习,核心技术涵盖微弱语音识别及噪杂环境音频增强,拟用于提升 AirPods 的翻译功能及 Vision Pro 的面部感知能力。

Q.ai 创始人 Aviad Maizels 曾于 2013 年向苹果出售 3D 传感公司 PrimeSense。交易完成后,Maizels 及其创始团队将整体加入苹果。

TechCrunch

🍀在花频道 🍵茶馆聊天 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
京东科技 JoyAI 赋能“京办”:开启超大城市政务智能化新篇章

近日,京东科技凭借其自研的 JoyAI 大模型,成功助力北京市“京办”平台实现智能化升级。通过 AI 与大数据技术的深度融合,政务办公正从“数字化”向“智能化”迈进,显著提升了超大城市的治理效率。

技术赋能:JoyAI 破解政务办公难题

针对政务工作中知识库分散、公文流转流程复杂等长期痛点,京东科技提供了系统性的解决方案:

公文写作提速:利用 AI 辅助生成的公文写作时间从原本的“天级”大幅缩短至“小时级”。

会议纪要自动化:会议纪要的生成效率提升了70%,极大释放了基层工作人员的精力。

知识集成与共享:JoyAI 帮助整合了碎片化的政务信息,实现了跨部门的智能协同。

落地成效:北京114家市级单位全覆盖

目前,“京办”平台已在北京市范围内取得了显著的应用成果:

广泛覆盖:服务范围已触达北京16+1个区 以及114家市级单位。

用户活跃度高:注册用户已接近80万,且月活率保持在50% 以上的高位。

未来展望:深化智能协同办公

京东科技表示,将继续深耕政务 AI 领域,通过技术的不断迭代,将“京办”平台的成功经验推广至更多地区。未来,AI 智能体将不仅是办公辅助工具,更将成为推动城市治理体系和治理能力现代化的核心驱动力。

via AI新闻资讯 (author: AI Base)
马斯克加码AI蓝图:xAI计划明年大规模推出定制化生成式游戏与影视

埃隆·马斯克再次对其人工智能公司 xAI 的愿景放出的“豪言”。据科技媒体 TweakTown 报道,马斯克曾在2025年预测,xAI 旗下的游戏工作室将于今年年底前推出一款“出色的 AI 生成游戏”。昨日,他进一步在 X 平台加码预期,宣称明年将大规模推出可实时生成、高画质且能高度个人定制的影视内容和电子游戏。

尽管目前市场上已有如《Arc Raiders》等部分使用 AI 技术辅助开发的游戏,但马斯克所描绘的“AI 生成游戏”更为激进——即从玩法、美术设计到关卡生成,全链路均由人工智能产出。

这一大胆构想引发了业界的广泛关注与质疑。截至目前,全球范围内尚未出现过真正令人印象深刻的纯 AI 生成游戏实机演示。马斯克此举被视为对 xAI 技术实力的极度自信,旨在颠覆传统内容创作范式。如果这一目标得以实现,游戏与影视行业将步入“实时定制化”的新时代,但这是否又是马斯克式的“跳票”预言,仍需时间检验。

via AI新闻资讯 (author: AI Base)
音乐出版商起诉Anthropic公司指控其盗版

由 Concord 音乐集团和环球音乐集团牵头的一群音乐出版商正在起诉Anthropic,称这家公司非法下载了超过两万首受版权保护的歌曲,包括乐谱、歌词和音乐作品。这些出版商在周三的一份声明中表示,损害赔偿金额可能超过30亿美元,这将成为美国历史上规模最大的非集体诉讼版权案件之一。诉讼书中指出:“尽管 Anthropic 误导性地宣称自己是一家人工智能‘安全与研究’公司,但其擅自传播受版权保护作品的记录清楚地表明,其价值数十亿美元的商业帝国实际上建立在盗版行为之上。”诉讼还将 Anthropic CEO 达里奥·阿莫代和联合创始人本杰明·曼列为被告。

—— Techcrunch

via 风向旗参考快讯 - Telegram Channel
腾讯“元宝派”内测截图泄露,社交+AI重构娱乐体验

近日,腾讯旗下AI助手“元宝”内测的社交功能**“元宝派”**因公测版本截图泄露成为行业焦点。此次泄露的核心看点在于其深度的生态整合与社交壁垒的突破。

在功能层面,“元宝派”新增了**“一起听音乐”“一起看视频”**功能。该功能疑似打通了QQ音乐与腾讯视频的资源库,支持好友同步观影、听歌并实时互动。更具颠覆性的是,“元宝派”实现了跨平台社交整合,用户可通过专属链接将微信与QQ好友拉入同一群组,首次打破了两大社交生态的长期隔阂。

此外,AI在群聊中扮演了“活跃分子”的角色。元宝不仅能提供智能总结、任务监督等工具化服务,还能进行图片二创生成梗图,甚至在冷场时主动“抛梗”调节气氛。

据ZEALER透露,马化腾计划投入10亿红包资源推广该功能,意图借春节时机复刻社交奇迹。目前,该功能仍处于内测阶段,其“人+AI+人”的三角互动模式能否引领社交赛道的新变革,值得市场持续关注。

via AI新闻资讯 (author: AI Base)
商汤重磅开源 SenseNova-MARS:开启多模态自主推理新篇章

2026年1月29日,商汤科技正式宣布开源其多模态自主推理模型 SenseNova-MARS,并同步提供8B 和32B 两个版本。这款模型的发布,标志着多模态大模型在自主推理领域迈出了关键一步。

技术突破:首个 Agentic VLM 模型

SenseNova-MARS在技术架构上实现了显著创新,是行业内首个将动态视觉推理与图文搜索深度融合的 Agentic VLM(智能体视觉语言模型)。

自主推理:模型不仅能理解图像内容,更具备类似智能体的自主规划与推理能力。

深度融合:通过将实时搜索能力融入视觉理解过程,模型能够处理需要外部知识支撑的复杂视觉任务。

行业影响与意义

商汤此次选择双版本开源,旨在为全球开发者提供更具灵活性的研究工具:

8B 版本:兼顾性能与效率,适合在端侧设备或有限算力环境下部署。

32B 版本:提供更强大的逻辑推理上限,满足复杂行业应用的需求。

via AI新闻资讯 (author: AI Base)
英国敦促谷歌允许网站选择退出AI概览功能

英国政府表示希望谷歌调整其搜索服务,为企业和消费者提供更多选择,包括允许出版商 “选择退出” 其内容被用于谷歌的AI概览功能或被用于训练独立AI模型。谷歌在英国占据超过90%搜索查询份额,其利用其搜索爬虫收集的内容构建 AI概述功能和AI模型,及其Gemini AI助手等独立产品。由于用户依赖借助AI生成的概览,新闻网站和其他出版商的点击率已出现大幅下降。竞争与市场管理局希望通过允许出版商 “选择退出” 谷歌的AI功能来调整这一平衡,同时不影响其在常规搜索中的排名。该机构还提议进行改革,以确保搜索结果排序的公平性与透明度,并让人们能更轻松地选择其他搜索引擎。

—— 路透社

via 风向旗参考快讯 - Telegram Channel
建筑业的“智慧进化”:2033年人工智能市场规模将达320亿美元

长期以来,建筑业一直被视为数字化转型的“慢热者”,受困于成本超支、项目延期及劳动力短缺等顽疾。然而,这一局面正在被彻底打破。根据Persistence Market Research的最新预测,全球建筑业人工智能(AI)市场将迎来爆发式增长:预计到2026年市场规模将达 62亿美元,而到2033年将攀升至 320亿美元,复合年增长率(CAGR)高达 26.4%

核心驱动:从“经验驱动”转向“数据驱动”

建筑公司正通过集成机器学习、计算机视觉和自然语言处理(NLP)等技术,在项目的全生命周期中寻找突破口:

● 规划与设计: 软件平台凭借可扩展性占据市场主导。通过与Autodesk等建筑信息模型(BIM)集成,AI能在开工前优化预算与资源分配。
● 现场执行与安全: 计算机视觉技术正快速普及,通过分析现场图像实时监控安全隐患,并检测实际进度与设计方案的偏差。
● 资产管理: 数字孪生技术与 AI 的结合,为后期设施的预测性维护提供了核心支撑。

市场格局:北美领跑,亚太增速最快

从全球视角来看,北美凭借成熟的数字化生态系统和风险投资支持,目前保持领先地位。但亚太地区(中国、印度、日本)受益于大规模城市化进程及政府对智慧基建的投入,正成为全球增长最快的区域。

挑战与机遇并存

尽管前景广阔,但行业仍面临高昂的初期实施成本、碎片化的非结构化数据以及传统企业内部的变革阻力。然而,随着云计算降低准入门槛,以及Oracle、IBM和Microsoft等科技巨头持续深耕,建筑业的“端到端数字化生态”已初具雏形。

via AI新闻资讯 (author: AI Base)
商汤开源 SenseNova-MARS:Agentic VLM 赋予 AI 独立“思考与行动”力

2026年1月30日,商汤科技正式开源了其首个支持动态视觉推理与图文搜索深度融合的 Agentic VLM 模型——SenseNova-MARS。该模型包含8B 和32B 两个版本,通过模拟“侦探破案”般的逻辑,实现了 AI 从单纯“理解”到自主“执行”的跨越。

性能飞跃:在多项榜单超越 GPT-5.2

在最新的行业基准测试中,SenseNova-MARS展现出了惊人的竞技状态:

搜索推理登顶:在 MMSearch(图文搜索核心评测)中以74.27分 登顶,显著超过GPT-5.2的66.08分。

细节搜寻领跑:在 HR-MMSearch(高清细节搜索评测)中获得54.43分,拉开了与主流闭源模型的差距。

多维能力验证:在 FVQA、InfoSeek 等多个权威视觉理解榜单中,均取得了开源模型中的 SOTA(当前最佳) 成绩。

核心黑科技:像人类一样协同工具

SenseNova-MARS的独特之处在于其“自主规划”能力,能够自动解决“细节识别 + 信息检索 + 逻辑推理”的复杂长链条任务:

图像细节裁剪:能聚焦占比不到5% 的微小细节(如赛车手服上的 Logo),并自动放大分析。

动态图文搜索:在识别物体或人物的瞬间,自动匹配全球范围内的相关信息,如设备型号或行业数据。

多跳深度推理:面对需要“先放大、再识别、最后查背景”的任务不再束手无策,具备极强的“工具使用直觉”。

训练秘籍:“因材施教”的双阶段演进

商汤研究团队通过两阶段训练,赋予了模型严密的逻辑链条:

第一阶段(打基础):利用自动化数据合成引擎构建“高难度案例库”,让 AI 学习基本的多跳搜索逻辑,确保起步即面对真实复杂场景。

第二阶段(练实战):引入 BN-GSPO 算法进行强化学习,像训练侦探一样,通过奖励机制平滑波动,让模型在处理各类问题时都能保持稳定进步。

拥抱开源:助力全球开发者

目前,商汤已将SenseNova-MARS的模型、代码及数据集全量开源。开发者可直接通过 Hugging Face 下载,共同探索具身智能与自主 Agent 的无限可能。

via AI新闻资讯 (author: AI Base)
Anthropic与五角大楼就AI使用限制产生分歧

去年夏天,Anthropic获得美国国防部一份价值两亿美元的合同。如今该公司与五角大楼的关系陷入困境。据知情人士透露,该公司和五角大楼在关于如何使用Anthropic技术的合同条款上存在分歧。合同授予后,该公司与美国政府的紧张关系几乎立即开始,部分原因是Anthropic的条款和条件规定,Claude不能用于任何与国内监控相关的行动。这限制了美国移民海关执法局和联邦调查局等执法机构部署该技术的程度。Anthropic对AI安全应用的关注,以及其反对将技术用于自主致命行动的做法,持续引发问题。一些政府官员不满该公司规定了其技术可如何使用。

—— 华尔街日报

via 风向旗参考快讯 - Telegram Channel
今年一月OpenAI Sora安装量环比下降45%

OpenAI的视频生成应用Sora在去年十月迅速登上苹果 App Store 榜首后,目前正面临困境。最新数据显示,随着人们对这款AI视频社交网络的早期热捧逐渐消退,该应用的下载量和用户消费额均出现下降。市场情报提供商Appfigures的数据显示,Sora在去年十二月的下载量环比下降32%。这一情况令人担忧,因为节假日通常是移动应用的增长契机,人们会收到新的智能手机作为礼物,而且往往有休假时间,从而更可能安装新应用和游戏。下降趋势持续至2026年一月,安装量环比减少 45%,降至 120万次。用户消费额同样出现下滑,截至一月环比下降32%。

—— Techcrunch

via 风向旗参考快讯 - Telegram Channel
腾讯混元大模型迎来顶级科学家:清华博士庞天宇加盟,领衔多模态强化学习

腾讯在 AI 人才版图上再下一城。2026年1月30日,清华大学计算机系博士、前新加坡 Sea AI Lab 高级研究科学家庞天宇宣布,将于2月4日正式入职腾讯。他将出任腾讯混元大模型团队首席研究科学家,并兼任多模态强化学习技术负责人。

人物履历:从清华学霸到顶级科学家

庞天宇是机器学习领域的知名青年学者,其履历极具含金量:

学术背景:1995年出生,高一即获得保送清华资格。2017年本科毕业于清华数理基科班,2022年取得清华计算机系博士学位,师从朱军教授。

研究成就:长期深耕机器学习鲁棒性与深度学习领域,在 ICML、NeurIPS 等国际 AI 顶级会议上发表论文70余篇,总引用次数已超过1.5万次。

业界荣誉:曾荣获微软学者奖学金、百度奖学金、英伟达学术先锋奖及 CAAI 优秀博士论文等数项重量级奖项。

职业轨迹:博士毕业后曾任职于新加坡 Sea AI Lab,主攻可信机器学习与生成式模型。

职责定位:深耕多模态与强化学习

在加盟腾讯混元团队后,庞天宇将主要负责多模态模型的强化学习研究:

研发重心:前期将聚焦于生成模型技术的突破。

团队架构:他所领衔的混元多模态部 Exploration Center,主要职能是承担强化学习前沿算法的探索任务。

腾讯混元大模型的“人才拼图”

此次庞天宇的加盟,是腾讯近期一系列“人才强基”动作的延续:

人才高地:2025年12月,前 OpenAI 研究员姚顺雨入职腾讯任首席 AI 科学家。马化腾曾表示,腾讯已通过人才引进完成了混元大模型的“深度重构”。

技术成果:1月28日,腾讯宣布开源混元图像3.0图生图版本,该模型已在国际图像编辑榜单进入第一梯队,并已接入 AI 助手“元宝”。

随着多位顶尖专家的加入,腾讯混元大模型正通过强化学习与多模态技术的深度融合,加速追赶全球 AI 技术的第一阵营。

via AI新闻资讯 (author: AI Base)
大厂抢人:清华学术新星庞天宇加盟腾讯混元,领军多模态RL研究

近日,AI学术界与产业界传来重磅消息,MLNLP学术委员、资深研究员庞天宇正式宣布加入腾讯混元(Tencent Hunyuan),出任首席研究科学家及多模态强化学习(Multimodal RL)技术负责人。目前,庞天宇已全面开启AI高端人才招聘,旨在组建顶尖团队,攻坚多模态生成与理解模型的前沿难题。

庞天宇履历极其亮眼,他是清华大学计算机系2017级直博生,师从著名学者朱军教授。在校期间,他深耕机器学习及深度学习鲁棒性领域,以第一作者身份在ICML、NeurIPS、ICLR等顶会发表多篇Oral及Spotlight论文,并曾斩获微软学者奖学金及英伟达学术先锋奖。在加入腾讯前,他曾担任新加坡Sea AI实验室高级研究科学家,具备深厚的学术积淀与工业界经验。

据悉,庞天宇在腾讯混元的工作将重点聚焦于强化学习与多模态模型的深度融合,涵盖扩散模型(Diffusion Models)与视觉语言模型(VLMs)等核心方向。此次“强强联合”标志着腾讯混元在多模态大模型技术攻关上更进一步。

via AI新闻资讯 (author: AI Base)
编程效率暴增:Kimi K2.5 接入 Kimi Code,三倍额度福利限时开启

月之暗面近日宣布,旗下最强编程模型、原生多模态大模型 Kimi K2.5正式接入 Kimi Code。为了庆祝这一技术跨越,官方同步推出了限时福利与重磅计费调整,旨在为开发者提供更畅快、更精准的 AI 编程体验。

性能飞跃:K2.5赋予编程新动能

作为 Kimi 家族的最新力作,K2.5模型在视觉理解、复杂代码逻辑和 Agent 集群能力上实现了显著突破。此次接入 Kimi Code,意味着开发者在处理多模态输入(如解析 UI 设计稿生成代码)以及应对高难度编程任务时,将获得更精准的响应和更强大的逻辑支持。

为了回馈用户,Kimi Code 开启了限时优惠活动:即日起至2026年2月28日,无论是新用户还是老用户,均可享受最高平时3倍的使用额度。更重要的是,本次活动取消了限速和购买限制,力求让每一位开发者都能在全速状态下体验 K2.5带来的高效产出。

计费变革:从“按次”转向“按 Token”

针对用户反馈,Kimi Code 完成了一项关键优化:正式取消基于请求次数的计费方案,全面切换为更科学、透明的 Token 计费模式。

● 按需扣减: 额度将严格根据用户实际输入和输出的长度计算。
● 精准算力: 简单的提问将仅消耗极少 Token,而复杂的任务则能获得更充足的发挥空间。

简单来说,新的计费方式让额度变得更“耐用”,确保每一分算力都精准服务于实际开发需求。目前,用户的所有配额已按照新方式重置,开发者可以立即访问 Kimi Code 官网,开启高效的 Happy Coding 模式。

via AI新闻资讯 (author: AI Base)
🌐 Google DeepMind 发布 Project Genie:可交互的实时生成式世界模型

Google DeepMind 近日推出实验性研究原型 Project Genie(Genie 3),该系统被定义为一种“世界模型”,能够根据文本提示或图像实时生成连贯、可导航且具有照片级真实感的虚拟环境。用户可以作为智能体在生成的空间中移动并进行交互,系统会根据用户的动作指令(如移动、跳跃)预测并渲染后续状态,确保物理因果关系在短时间内保持一致。

技术实现上,Genie 3 采用扩散变换器(Diffusion Transformer)架构,通过潜在动作和帧序列预测世界状态。与需要显式 3D 表示的 NeRF 或高斯泼溅技术不同,Genie 的环境一致性属于涌现能力,完全基于帧对帧的生成。目前该原型支持 720p 分辨率,控制延迟低于 10FPS,最大上下文滚动长度为 60 秒。

该模型的核心研发目标并非单纯的娱乐产品,而是作为下一代 AI 和机器人系统的“想象力”训练场。通过在模拟世界中运行大量潜在行动方案,智能体可以学习处理复杂任务并预测后果,从而降低现实开发成本。在应用前景方面,该技术被认为将革新游戏开发、电影制作及工业仿真领域,例如通过单张照片快速构建可交互的 3D 场景。

然而,该技术也引发了广泛的专业讨论与质疑。部分技术评论者指出,Genie 本质上是基于视频数据的“幻觉模拟”,而非基于严谨物理定律的引擎,因此在处理复杂流体动力学或长期环境一致性时仍存在局限和漂移现象。此外,高昂的计算成本、能源消耗以及可能带来的数字成瘾和虚假信息风险也是讨论的焦点。在行业竞争层面,Genie 的路线与 Meta 首席科学家 Yann LeCun 倡导的非生成式世界模型(如 JEPA)形成对比,反映了当前 AI 领域对实现通用人工智能(AGI)路径的不同探索。

(HackerNews)

via 茶馆 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]