https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
Antigravity 新增低用量模型并重置付费配额

Antigravity 收到反馈称简单任务仍消耗过多 token,因此正式加入 Gemini 3.5 Flash(Low)作为优化方案。内部测试中,该模型比 Gemini 3.5 Flash(Medium)少生成约 45% 的 token,且 SWE 任务表现普遍优于 Gemini 3 Flash(High)。

与此同步,所有付费计划的 Gemini 配额已全部重置,以保障用户接下来一周的开发用量。

Varun Mohan(@_mohansolo)

🌸 在花频道 · 备用频道 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
全球Token消耗量持续攀升 DeepSeek大模型登顶调用榜

在 AI Agent等应用带动下,全球词元消耗量进一步攀升。根据 OpenRouter 最新数据测算,上周(18日至24日)全球AI大模型总调用量为28.9万亿Token,较此前一周增长7.4%。调用量已连续五周上涨,大模型调用需求仍在持续释放。其中,上榜的AI大模型中,中国AI大模型周调用量达9.22万亿Token,环比增长19.89%;同期美国AI大模型周调用量为4.93万亿Token,环比增长16.27%。中国大模型周调用量连续四周超过美国并稳居全球首位。截至目前,DeepSeek-V4-Flash 已登顶OpenRouter全球AI大模型调用榜。

—— 财联社

via 风向旗参考快讯 - Telegram Channel
谷歌 CEO 皮查伊:坦诚承认编程领域落后,AI 搜索转型将采取“稳健策略”

谷歌 I/O 大会落幕后,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)做客知名科技播客《Hard Fork》,就大模型竞争、搜索模式变革及 AI 安全等核心问题进行了深度对话。这是谷歌在 AI 竞赛中面对多重挑战背景下的一次罕见坦诚交流。

核心观点概览

● 模型评估: 谷歌在整体智能和多模态能力上处于行业前沿,但在代理式编程(agentic coding)和处理复杂长周期任务上,目前确实落后于竞品。
● 搜索变革: 谷歌不会激进地全面切换至 AI 模式。搜索链接与来源将长期保留,订阅与广告结合的商业模式在 AI 时代依然稳健。
● 智能体推广: AI 智能体(如即将发布的 Spark)将采取“分步推进”策略,重点在于防范边界安全和越界行为,以防范用户产生“退缩心理”。
● 算力逻辑: 谷歌持续向竞争对手开放 TPU 访问权限,旨在通过规模经济和生态协作,保持在硬件前沿的领先地位。
● AGI 预警: 随着近两年技术的爆发式演进,实现 AGI 的预期节点正在加速靠近。即使短期未达终点,未来三年的技术能力也将出现代际跃升,社会必须提前做好准备。

访谈精选:关于竞争、焦虑与未来

1. 关于“落后”的坦诚:承认编程短板

针对外界质疑,皮查伊直言不讳地表示:“我们的模型在文本、音频和通用推理上极具竞争力,但在代理式编程和指令遵循上确实稍逊一筹。”他将编程视为谷歌必须坚守的“核心前沿”,并透露团队正在通过后训练(post-training)迅速修复 Gemini 3.5 Flash 出现的性能退化问题。他认为,当前这个领域“30 到 60 天就仿佛跨越了五年”,竞争格局瞬息万变。

2. 关于搜索:不会“撕掉创可贴”

面对“何时取消经典搜索界面”的提问,皮查伊强调了“引导用户”的重要性。他表示,谷歌将采取有条不紊的渐进策略,而非激进切换。他指出,用户依然需要搜索链接这种高效的连接方式,这不仅仅是产品习惯,更是信息验证的刚需。

3. 关于焦虑:技术变革的必然阵痛

当谈及公众对 AI 的抵制情绪时,皮查伊展现了作为管理者的审慎。他认为,人类的进化速度确实无法完全跟上技术演进的惊人速度,产生焦虑是“自然的、合理的”。但他指出,AI 带来的积极影响(如医疗放射科的工作效率提升)被低估了,他不认同过于确定的悲观预测,但也强调社会必须参与并表达偏好,以引导技术向善。

4. 关于 AGI:正处于演进的关键节点

对于“奇点”是否到来,皮查伊表示,向 AGI 迈进是必然趋势。虽然他避开了给出一个具体的日期,但他明确承认,过去一两年的技术进展速度已经超出了他原有的预期,AGI 的实现节点比预想的要近。他特别强调:“公众不应因为认为 AGI 尚需时日就放松准备。”

市场解读:谷歌的守成与进取

皮查伊此次访谈透露出一种明确的信号:谷歌正在经历从“全能型选手”到“聚焦差异化竞争”的转变。

● 在硬件端: 谷歌维持了其作为 AI 算力“军火商”的地位,通过开放 TPU 换取技术迭代的节奏。
● 在产品端: 面对 Anthropic 和 OpenAI 在编程工具(如 Cursor 联动)上的先发优势,谷歌正表现出极强的反思与追赶姿态。
● 在信任端: 谷歌在智能体产品上的“透明度”策略,暗示其深知 AI 落地最大的敌人不是技术瓶颈,而是用户的“不信任感”。

此次访谈不仅是谷歌对外界疑虑的一次回应,更像是一次对全行业的提醒:在人工智能这场深远的变革中,没有任何一家公司能永远坐在领先的位置上,唯有通过不断的技术迭代与深刻的社会应对,才能在接下来的三年中立于不败之地。

via AI新闻资讯 (author: AI Base)
xAI 祭出“杀手锏”:1.5 万亿参数 Grok V9-Medium 训练完成,直指编程 AI 赛道

全球 AI 算力竞赛再次加码。5 月 25 日,埃隆·马斯克(Elon Musk)正式宣布,xAI 旗下最新旗舰模型 Grok V9-Medium 已圆满完成训练阶段。作为一款拥有 1.5 万亿(1.5T)参数的超大规模基础模型,其规模是目前支撑 Grok 所有生产线流量的 v8-small 版本(0.5T 参数)的整整三倍。

核心看点:

● 规模跨越: 从 0.5T 直接跃升至 1.5T 参数,模型在推理深度与复杂任务处理能力上实现了质的飞跃。
● 编程特化: 在补充训练阶段,xAI 引入了海量 Cursor(AI 编程工具) 的代码数据,旨在显著增强其处理复杂编程任务的能力。
● 进度时间表: 目前模型已进入监督微调(SFT)阶段,强化学习(RL)即将启动,预计在 2 至 3 周内正式面向公众发布。
● 底层架构优化: 马斯克透露,该模型经过了针对 NVIDIA Blackwell 架构 GPU 的深度优化,算力效率将大幅提升。



“编程 AI”新格局:xAI 正面硬刚顶尖代码助手

此次 Grok V9-Medium 的发布,最引人瞩目的在于其“编程基因”。马斯克此前曾坦言,现有的 v8-small 版本在训练数据的质量、全面性及比例平衡上存在明显短板,而 V9-Medium 则是针对这些痛点进行的系统性重构。

通过引入 Cursor 的代码逻辑与实战数据,xAI 意图让这款新模型在开发者生态中建立绝对的技术优势。对于开发者而言,Grok V9-Medium 不仅仅是一个通用的聊天机器人,更有望成为能够深度理解复杂代码库、自主完成复杂编程逻辑的“AI 工程师”。

为什么要加 Cursor 的数据?

Cursor 作为当前主流的 AI 编程辅助工具,其背后的代码调用习惯、工程化思路和 bug 修复路径代表了顶尖软件工程的实践。xAI 将这些数据纳入“补充训练”(Supplemental Training),意味着 Grok 将跳过单纯的语言模型阶段,直接进入“工程化实践”阶段。

这种做法被行业观察者视为 xAI 的“换道超车”:不再仅仅通过通用的语料库进行训练,而是直接学习人类专业工程师在编程工具中最真实、最直接的思维方式。

市场预期:大模型“基准”之战将重写

随着 Grok V9-Medium 预计在 6 月中旬上线,AI 领域的竞争将进入新一轮白热化:

● 性能标杆的重塑: 1.5T 参数规模意味着它在逻辑推理与复杂指令遵循上,将直接对标业界最顶尖的多模态模型。
● Blackwell 架构的红利: 作为首批深度适配 Blackwell 架构的 AI 大模型,其在处理效率和推理成本上的表现,将直接影响 xAI 在 Tesla 车辆端侧与 X 平台应用端的部署策略。

对于 xAI 团队而言,Grok V9-Medium 不仅是性能上的升级,更是其构建“开发者优先”AI 平台的关键一步。在接下来的两周内,随着微调与强化学习工作的收尾,这款“编程利器”的表现将决定它能否在代码辅助与开发者工具赛道中,从 Anthropic 的 Claude 或 DeepSeek 等竞争对手手中分得一杯羹。

via AI新闻资讯 (author: AI Base)
OpenAI斥巨资在新加坡建实验室,开启首个海外AI大本营

人工智能巨头OpenAI近日正式与新加坡政府签署多年期合作协议。公司承诺将投入超过2. 34 亿美元(约合 3 亿新元),在新加坡设立其在美国本土以外的首个应用人工智能实验室。

携手政府布局三大核心方向

该实验室将作为双方深化合作的核心载体,未来将主要聚焦于三大战略方向。其中包括帮助新加坡公共和私营机构部署前沿AI,培养下一代本地AI人才,以及推动AI技术惠及普通民众与各类企业。

为了达成这一目标,OpenAI计划与当地教育部和政府科技局展开紧密合作。双方将共同开发AI驱动的教育工具,并开设新加坡版的OpenAI学院,以此来全面扩大AI工具在当地的可及性。

招揽顶尖人才与加速全球部署

在未来的几年时间里,该实验室预计将为新加坡当地创造超过 200 个技术岗位。这些岗位将广泛涵盖技术专家与工程师,使新加坡成为其全球前沿部署工程师的重要枢纽之一。

这些前沿部署工程师作为OpenAI的独特技术角色,将直接与企业机构合作解决最棘手的技术难题。此举不仅正值新加坡加速建设全球AI枢纽之际,也标志着OpenAI在东南亚及全球的商业化落地迈出了关键一步。

via AI新闻资讯 (author: AI Base)
OpenAI重磅投资新加坡:2.34 亿美元打造全球首个海外AI实验室!

在全球人工智能领域快速发展的浪潮中,OpenAI 宣布与新加坡政府达成了一项历史性的合作协议,计划在这座东南亚城市国家投资超过 3 亿新元(约合 2.34 亿美元),设立其在美国本土以外的首个应用人工智能实验室(Applied AI Lab)。这一实验室不仅是 OpenAI 扩展全球影响力的重要举措,也是新加坡加速建设全球 AI 枢纽的关键一步。

根据协议,OpenAI 的实验室将重点关注三大领域:首先是协助新加坡的公共和私营机构应用最前沿的 AI 技术,解决实际问题;其次是培养本地下一代 AI 人才,以确保新加坡在未来技术竞争中的领先地位;最后是推动 AI 技术的普及,让普通民众、各类企业和公共部门都能受益。

预计在未来几年内,OpenAI 将在新加坡创造超过 200 个高技术岗位,涵盖技术专家与工程师等多种角色,旨在将新加坡打造成全球前沿部署工程师(Forward-Deployed Engineers)的重要枢纽。前沿部署工程师在 AI 研究与实际应用之间架起了桥梁,他们将直接与企业和机构合作,帮助解决一些最具挑战性的问题。

在人才培养方面,OpenAI 计划与新加坡教育部和政府科技局密切合作,开发以 AI 驱动的教育工具,助力学生更高效地学习本土语言。此外,OpenAI 还将在新加坡设立专门的 OpenAI Academy,并计划举办以 “Codex for Teachers” 为主题的黑客马拉松活动。这一系列举措将进一步巩固新加坡作为全球顶尖 Codex 用户市场的地位。

此次投资合作的宣布,正值新加坡政府加速推动 AI 技术发展的关键时刻。当天,新加坡还同时与谷歌和英伟达达成了 AI 合作协议,显示出该国在全球 AI 产业中越来越重要的地位。新加坡数字发展及新闻部长杨莉明指出,像英伟达这样的科技巨头选择在这里深化布局,正是因为新加坡为全球科技发展增添了不可或缺的价值。

OpenAI 首席营收官 Denise Dresser 也表示,新加坡拥有丰富的技术人才、可信赖的机构和明确的长期增长愿景,这些都与 OpenAI 的使命不谋而合。通过此次合作,OpenAI 希望帮助更多的机构实现 AI 技术的落地,为下一代 AI 人才的培养贡献力量,并在全国范围内推动 AI 工具的普及。

via AI新闻资讯 (author: AI Base)
人工智能时代网络安全专家需求激增

人工智能带来的代码膨胀和新型安全威胁,正推动企业大规模招聘网络安全人才。今年一季度相关岗位招聘量同比增长 11%,猎头公司称高管职位需求较去年秋季增加了五到七倍,部分公司甚至因人手不足拒绝接单。

随着 Anthropic 的 Mythos 等模型展现出发现和利用软件漏洞的能力,企业急需既懂安全技术又能驾驭 AI 复杂性的高管。目前高级安全岗位薪酬包可达七八百万美元,安全工程师也需补充 AI 技能才能保持竞争力。

The New York Times

🌸 在花频道 · 备用频道 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
OpenAI投2.34亿美元在新加坡设首个海外AI实验室

OpenAI近日与新加坡政府签署多年期合作协议,承诺投入超过3亿新元(约合2.34亿美元),在当地设立其美国本土以外的首个应用人工智能实验室(Applied AI Lab)。

该实验室将作为双方合作的核心载体,聚焦三大方向:帮助新加坡公共和私营机构部署前沿AI并解决问题;培养下一代本地AI人才;推动AI技术惠及普通民众、各类企业及公共部门。

OpenAI预计未来几年内为新加坡创造超过200个技术岗位,涵盖技术专家与工程师,使新加坡成为其全球前沿部署工程师(Forward-Deployed Engineers)的重要枢纽之一。

前沿部署工程师是OpenAI独特的技术角色,他们坐在前沿研究与实际部署的交汇点,直接与企业和机构合作解决 hardest 问题并解锁新价值来源。该实验室将支持新加坡在公共服务、金融、医疗和数字基础设施等国家优先领域的AI应用。

人才方面,OpenAI计划与当地教育部和政府科技局合作,开发AI驱动的教育工具,例如帮助学生有效学习本土语言的AI应用。公司还将开设新加坡版OpenAI Academy,并举办Codex for Teachers黑客马拉松。新加坡目前已是全球顶尖的Codex用户市场之一。

此次合作正值新加坡加速建设全球AI枢纽之际。该国政府同日还宣布与Google和英伟达分别达成AI合作协议。Google将扩展其在新加坡的企业AI部署,英伟达则在当地设立聚焦机器人技术和AI基础设施的新研究实验室。

新加坡数字发展及新闻部长杨莉明表示,像英伟达这样的领先企业选择在此深化布局,是因为新加坡为其全球版图增添了宝贵价值。

OpenAI首席营收官Denise Dresser表示,新加坡拥有强大技术人才、可信机构和利用AI推动长期增长的清晰雄心,OpenAI希望通过此次合作帮助更多机构受益于前沿AI,支持下一代本地AI人才,并在全国范围内扩大AI工具的可及性。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:BiaNews鞭牛士)
Zoom 对Anthropic 的投资回报超十亿美元

Zoom 最近披露的监管文件显示,该公司在人工智能新创企业 Anthropic 的早期投资,已经为其带来了超过十亿美元的财务回报。想必这个回报率让许多投资者都心动不已。

早在 2023 年 5 月,Zoom 通过其创投部门 Zoom Ventures 投资了约 5100 万美元于 Anthropic。这笔投资如今已经增值至近 13 亿美元,显示了 AI 行业的巨大潜力。此番投资的初衷是为了将 Anthropic 开发的 Claude 大型语言模型,整合进 Zoom 的联邦式 AI 架构中,以提升其产品和服务的智能化水平。

随着技术的快速发展,Anthropic 即将进行新一轮融资,这将进一步推动 Zoom 所持有的少数股权的估值提升。业内人士认为,随着 AI 技术的日益成熟,投资于这一领域的企业将迎来更为广阔的发展前景,而 Zoom 显然在这一波浪潮中走在了前面。

值得一提的是,Zoom 的这项投资不仅为公司带来了可观的经济回报,还可能在未来改变其商业模式和用户体验。通过整合 Claude 模型,Zoom 能够更好地满足用户需求,并提供更高效的在线沟通解决方案。这样的发展,势必让 Zoom 在激烈的市场竞争中占据有利位置。

当然,这也提醒了我们,在数字化转型加速的今天,企业之间的合作与创新是推动行业进步的关键。Zoom 与 Anthropic 的携手合作,或许只是未来更多科技巨头共同探索 AI 领域的开始。

总的来说,Zoom 的投资不仅仅是数字上的成功,更是对未来智能科技的坚定信念。随着更多 AI 技术的涌现,用户将享受到更加智能和便捷的服务,而这一切,正是 Zoom 所追求的目标。

划重点:

🌟 Zoom 对 Anthropic 的早期投资已带来超十亿美元的回报,显示出 AI 行业的巨大发展潜力。

🚀 投资初衷是将 Claude 大型语言模型整合到 Zoom 的 AI 架构中,提升用户体验。

💡 随着 Anthropic 即将进行新一轮融资,Zoom 的股权估值还有望进一步上升!

via AI新闻资讯 (author: AI Base)
中国大模型调用量连续 4 周碾压美国:全球 AI 开发者正加速“国产化”

根据 OpenRouter 刚刚发布的最新监测数据,全球大模型调用市场正在经历一场“向东看”的剧烈范式转移。上周(5 月 18 日至 5 月 24 日),全球 AI 大模型总调用量攀升至 28.9 万亿 Token,环比增长 7.4%,展现出连续五周不间断的强劲增长势头。

在这场算力与应用的全球博弈中,中国大模型不仅在规模上实现了对美国的持续领跑,其增长速度更展现出惊人的爆发力。

核心数据洞察:

● 全球总盘: 全球周调用量高达 28.9 万亿 Token,连续 5 周上涨,AI 基础设施进入高频常态化调用阶段。
● 中国领跑: 中国 AI 大模型周调用量达 9.223 万亿 Token,环比激增 19.89%
● 美国紧随: 美国 AI 大模型周调用量为 4.93 万亿 Token,环比增长 16.27%。
● 领先态势: 中国大模型已连续四周周调用量超过美国,且领先优势正在进一步拉大。



从“追赶”到“主导”:中国 AI 调用量的三重逻辑

中国大模型调用量之所以能实现对美国的“反超”,并连续四周稳居全球首位,背后不仅是量的积累,更是质的飞跃:

1. 高性价比的“工业级”API 生态

相比于美国模型在 API 价格上的高高在上,中国模型(如智谱 GLM 系列、DeepSeek、Qwen 等)在保持旗舰级性能的同时,提供了极具竞争力的定价方案。这种“高智能+低延迟+高性价比”的组合,迅速捕获了全球尤其是新兴市场开发者的心。

2. 开发者生态的深层融合

OpenRouter 数据显示,中国大模型正在被更深地嵌入全球开发者的工作流中。无论是 AI Agent 开发、自动化编程还是大规模内容生成,中国模型的推理环境兼容性越来越好,使得海外开发者在构建复杂应用时,愿意将中国模型纳入模型路由(Model Routing)的核心调用链。

3. 应用侧的“降维打击”

从 5 月份发布的一系列 AI 产品来看,无论是字节跳动的 Lance 3B 原生多模态模型,还是智谱 GLM-5.1 的 400 tokens/s 高速 API,中国 AI 产业的叙事逻辑已经从“单纯刷榜”转向了“实战降本”。这种能解决实际业务痛点的模型,自然在调用量上体现出更高的粘性。

行业预测:AI 基础设施的“多极化”时代已来

尽管中国在调用量上占据了全球头把交椅,但行业分析师指出,这并非单纯的“胜负之争”,而是全球 AI 基础设施多极化的必然结果:

● 中美模型双轨制: 全球开发者正日益习惯于在调用链中同时混合使用中美模型。针对不同任务负载,选择性价比最高的 API 已成为开发者的基本操作。
● 算力与数据的双循环: 调用量不仅是数字,更是训练数据和反馈闭环的来源。中国模型调用量的持续领先,意味着中国 AI 正在获取更多元、更全球化的语料反馈,这反过来又会加速中国模型的迭代周期,从而形成“调用增加 -> 性能优化 -> 调用再增加”的正向增强循环。

对于开发者而言,2026 年的 AI 版图已经变得前所未有的广阔。随着中国大模型以更深、更快的姿态融入全球开发者体系,我们可以预见,全球 AI 应用的开发成本将进一步降低,而创新的爆发点,或许就在下一次 API 调用的毫秒之间。

via AI新闻资讯 (author: AI Base)
物理AI时代的“视觉基建”:奥比中光如何重塑机器人感知?

随着人工智能从虚拟数字世界向真实物理空间延伸,“物理AI”(Physical AI)已成为全球科技产业竞逐的新高地。在这一进程中,如何让机器人“看懂”并“感知”物理世界,成为了大模型落地的关键瓶颈。 国内3D 视觉龙头奥比中光正通过其全栈式技术矩阵,精准卡位这一刚需,致力于成为物理AI时代的“视觉基础设施提供商”。

1. 战略定位:从“硬件供应商”到“产业中台”

与传统零部件供应商不同,奥比中光将自身定位为物理AI与机器人视觉产业中台。其核心使命是为物理AI设备赋予“感知即服务”的底层能力,打破了以往“孤立硬件”的局限。

● 感知基座: 为具身智能、服务机器人与工业机器人提供“眼睛”,帮助智能体在复杂环境下实现避障、导航与精细操作。
● 连接物理与数字: 构建起覆盖“芯片+算法+光机”的三位一体全栈技术矩阵,不仅解决了感知硬件的自主可控问题,更通过全栈式方案降低了开发者使用高精度3D 视觉的门槛。

2. 深度协同英伟达:打通“现实与仿真的鸿沟”

奥比中光通过与英伟达(NVIDIA)的深度生态协同,为物理AI的训练提供了不可或缺的“数据底座”:

● 仿真入驻: Gemini 系列双目结构光相机已入驻 NVIDIA Isaac Sim 仿真平台,提供物理级准确的传感器模型,极大缩短了“仿真测试”到“物理部署”的迭代周期。
● 硬件适配: 其3D 视觉产品全面适配 NVIDIA Jetson Thor 系统级模块(具身智能核心算力),实现了从感知输入到计算决策的完整链路打通。
● 感知集成:NVIDIA Isaac Perceptor 集成,为机器人提供高性能的自主导航与环境感知支撑。

3. 数据底座:物理世界的“数字孪生入口”

物理AI的进化离不开海量真实三维数据的支撑。奥比中光凭借高精度3D 扫描技术,为世界模型构建提供了核心数据燃料:

● 三维锚点: 通过高精度3D 扫描,将现实世界的物理约束、几何结构进行数字化建模,为世界模型训练提供“锚点”。
● 规模化交付: 依托顺德(智能制造基地)+越南(海外 OEM/供应链)双基地布局,奥比中光已具备千万级3D 视觉传感器与百万级机器人终端的量产能力,确保了物理 AI 全球落地的数据与硬件底座供应。

4. 行业应用:物理AI的“行业标配”

目前,奥比中光的3D 视觉方案已广泛渗透至多个核心场景,成为行业的“硬核选择”:

总结

在物理AI时代,奥比中光不仅是在生产视觉传感器,而是在构建一套支撑具身智能发展的基础设施。通过打通“现实采集—仿真训练—物理执行”的闭环,奥比中光正在将“视觉感知”这一关键拼图,稳稳嵌入全球物理 AI 的产业版图中。

via AI新闻资讯 (author: AI Base)
字节跳动联合港科大发布MMProLong:长文档LMM训练问答对效率远超OCR转录

5月24日,字节跳动Seed团队联合香港科技大学发布了一项针对多模态大语言模型(LMM)长文档训练的最新研究成果。研究人员基于阿里巴巴开源的Qwen2.5-VL构建了名为 MMProLong 的新模型,并在长文档处理效率上取得突破性进展。该研究不仅打破了多模态模型长文本训练的传统路径,更揭示了数据组织形式对模型长上下文能力的关键影响。

这项研究的核心发现直击当前LMM训练的痛点:在多模态长文档训练中,针对特定目标进行问答对(QA)训练的效果显著优于传统的字符识别(OCR)转录。实验表明,纯文本转录作为训练任务非但无法提升模型在长上下文中的定位能力,反而会导致性能下降;而通过独立模型(如字节跳动Seed2.0)生成的长上下文问答对进行训练,则能引导模型在冗长干扰信息中精准检索目标段落。

基于这一优化策略,MMProLong 在仅 128,000个Token 的有限训练预算下,展现出极强的长文本稳定性,在输入长度达到 256,000乃至512,000个Token 时依然没有出现性能崩溃,并在 MMLongBench 和 MM-NIAH(大海捞针)基准测试中大幅超越 InternVL3-38B 和Gemma3-27B等体量更大的开源模型。此外,MMProLong 的多模态能力还成功迁移至未经专门训练的长视频理解任务中,并在Qwen3-VL-8B模型上同样验证了该策略 water-proof 的有效性。

此项研究为当前大模型行业提供了一条不同于 DeepSeek(通过视觉信息高度压缩与重新排序升级架构)的演进路线,证明了通过优化训练数据结构而非改动底层架构,同样能实现长上下文能力的跨越式提升,为未来更长模态、多步骤智能体的开发开辟了更为经济、高效的技术可行性。

via AI新闻资讯 (author: AI Base)
DeepSeek V4 降价,宁德时代等巨头争相投资 AGI 梦想近在咫尺!

5月23日,该公司宣布其 V4-Pro API 将于6月1日起实施永久降价,此举将使 API 的价格降低到原来的四分之一。这一决定不仅有助于吸引更多开发者,也显示了 DeepSeek 在 AI 领域的强大决心。

与此同时,DeepSeek 正迎来融资热潮。根据多家媒体的报道,宁德时代正在接洽 DeepSeek 进行融资,意图在 AI 数据中心的电力设备市场拓展。除了宁德时代外,京东和网易等大公司也在考虑参与投资。融资的规模可能高达700亿元人民币,估值已经飙升至450亿美元,标志着 DeepSeek 正处于快速发展的轨道上。

DeepSeek 创始人梁文锋在与潜在投资者的会议上表示,公司将优先关注突破性人工智能(AGI)的研究,而不是短期的商业利益。这一声明凸显了 DeepSeek 在科技创新方面的雄心,同时也坚定了其开源路线的承诺。这一理念与 DeepSeek 持续降价的举措相辅相成,表明公司希望让先进的 AI 技术更易于大众获取。

投资方面,宁德时代的参与引发了关注。虽然它以电池制造著称,但近年来已扩展至数据中心储能领域。其投资 DeepSeek,可以看作是锁定了一个潜在的巨大客户。DeepSeek 正在内蒙古建立数据中心,利用当地丰富的电力资源,进一步巩固其在 AI 和电力基础设施的战略地位。

整体来看,DeepSeek 的融资进展与降价措施反映了其在 AI 领域的战略布局和长远目标,尤其是在推动 AGI 技术的前景上,深具潜力。

划重点:

🌟 DeepSeek V4-Pro API 宣布永久降价,价格降至原来的四分之一,以吸引更多开发者。

💰 宁德时代等巨头正在洽谈投资 DeepSeek,融资规模或达700亿元人民币,估值飙升至450亿美元。

🤖 创始人梁文锋强调追求 AGI 技术发展,而非短期商业化,坚定开源路线。

via AI新闻资讯 (author: AI Base)
阿里千问发布新一代大模型Qwen3.7-Max

5月22日,阿里千问官方公众号宣布,全新一代智能模型 Qwen3.7-Max 正式接入千问 App、PC 端和网页端。用户只需将千问 App 更新至6.9.7及以上版本,便可通过应用内的 “Qwen3.7-Max” 按钮或 PC 网页的模型选择栏进行切换,立即体验这一最新的智能助手。

Qwen3.7-Max 不仅是一款普通的 AI 模型,更是一个全能的智能体基座。其设计旨在处理多种复杂任务,无论是编写和调试代码,还是实现办公流程自动化,甚至在长达数百小时的任务中进行自主执行,Qwen3.7-Max 都能胜任。根据官方介绍,该模型在多个领域展现出卓越的能力。

首先,在编程领域,Qwen3.7-Max 可以处理从前端原型开发到复杂多文件工程的各种任务,极大地提高了开发效率。其次,在办公与生产力方面,通过多智能体协作与工作流自动化,Qwen3.7-Max 使得日常办公变得更加高效,用户的工作体验得到显著提升。此外,该模型在长周期任务中的表现也令人瞩目,曾在一项长达35小时、超过1000次工具调用的实验中展现出稳定的推理和执行能力,这表明其在复杂任务中也能持续发挥作用。

值得一提的是,Qwen3.7-Max 不仅在阿里云百炼平台上提供服务,还具备优越的跨框架泛化能力,能够在 Claude Code、OpenClaw、Qwen Code 等多个框架中稳定运行。这为开发者和企业提供了更大的灵活性与选择。

随着技术的不断进步,Qwen3.7-Max 的发布无疑为智能办公和生产力的提升带来了新的可能性。用户可以通过阿里云百炼 API 调用这一强大的模型,开启智能工作的新篇章。

划重点:

🌟 Qwen3.7-Max 可在千问 App、PC 和网页端自由切换,用户体验更加便捷。

💻 该模型支持多种复杂任务,包括编程、自动化办公及长周期任务执行。

🚀 具备跨框架能力,能在多个开发环境中稳定运行,为开发者提供更大灵活性。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]