ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

2 小时前

谷歌云发布开放知识格式 OKF，打造 AI 代理标准化知识底座

谷歌云（Google Cloud）近日正式推出“开放知识格式”(Open Knowledge Format，简称 OKF)，旨在通过标准化手段打破企业内部数据的碎片化僵局，为 AI 代理(AI Agents)构建高效的知识输入体系。在当前生成式 AI 落地进程中，PDF、Office 及各类专有系统中的非结构化文档因解析难度大，严重制约了大模型的语义理解精度与响应质量。OKF 的发布，标志着谷歌在 AI 基础设施层面的关键布局。

该格式将零散文档统一转化为带有 YAML 元数据的 Markdown 形式，正式确立了“LLM-Wiki”模式的开放标准。OKF v0.1版本强调厂商中立性与互操作性，允许开发者在无需专有平台或 SDK 的情况下，构建可跨模型、跨代理流动的知识库。其核心价值在于将复杂的企业知识解构为易于检索的“知识原子”，并通过 Markdown 链接构建起丰富的语义关联图谱。

行业专家指出，在全球 AI 领域加速迈向代理化（Agentic）的背景下，OKF 的推出是对检索增强生成(RAG)架构的底层优化。在 Anthropic 发布“电脑使用”功能、OpenAI 推出 Swarm 框架的行业周期内，谷歌选择深耕知识表征层，试图从数据标准入手降低企业构建私有化 AI 引擎的门槛。这不仅提升了 AI 代理的可靠性，也为未来企业级 AI 规模化协作奠定了坚实的标准化基石。

via AI新闻资讯 (author: AI Base)

2 小时前

上海交大等团队推出 SWE-Explore 基准测试，揭示 AI 编码智能体行级定位缺陷

一个由上海交通大学参与的国际研究团队今日正式推出全新基准测试工具 SWE-Explore，该工具通过将代码搜索与实际修复阶段进行解耦评估，首次量化揭示了当前 AI 编码智能体在“行级精度”上的重大技术短板。这一研究打破了以往仅依赖“最终修复率”的单一评估模式，为智能体上游搜索质量的直接衡量提供了全新标准，正推动 AI 软件工程评测向深水区演进。

传统的 SWE-bench 等基准测试因仅关注端到端的结果，往往掩盖了智能体在代码阅读与理解阶段的真实缺陷。为此，研究团队基于 GPT-5.4、Gemini3Pro、Claude Sonnet4.6及 Kimi K2.6等主流大模型的成功运行轨迹，提取出多条独立解路径交汇的共识代码段作为参考值，构建了包含10种编程语言、203个开源项目的848个缺陷任务数据集。

评测结果显示，尽管 Claude Code、OpenHands 等通用编码智能体在“文件级”定位上表现卓越，但在聚焦到具体的“代码行”时，其核心区域覆盖率骤降至14% 到19% 之间。消融实验进一步证实了“最小上下文阈值”效应的存在:当关键核心区域的可见比例低于50% 时，模型修复基本宣告失败;而一旦跨越50% 至75% 的阈值，修复成功率才会出现断崖式回升。

这一研究成果表明，当前 AI 智能体的瓶颈并非完全在于补丁编写能力，而在于对关键上下文的精准过滤与捕捉。在当前行业内诸如项目经理拒绝半数自动化采纳方案的现实背景下，SWE-Explore 提出的“少过滤、多阅读”技术导向，不仅为下一代专门化代码定位系统（如 CoSIL 等）的架构优化指明了方向，也将加速自动化软件工程从“暴力生成”向“精准检索”的范式转变。

via AI新闻资讯 (author: AI Base)

2 小时前

AI数据库交互迎来里程碑：谷歌新模型Gemini-SQL2 刷新行业标杆

在人工智能技术快速演进的今天，让AI精准理解并处理数据库查询任务一直是行业攻克的重点。6月12日，Google Research正式发布了全新模型Gemini-SQL2。这款基于Gemini3.1Pro打造的专用模型，在处理“文本转SQL”（Text-to-SQL）任务上表现出卓越能力，一举登顶权威评测榜单。

所谓“文本转SQL”，核心在于让计算机读懂人类的日常对话，并将其转化为可执行的数据库查询指令。在企业级应用、数据自助分析及SaaS平台等场景中，这项技术能极大地降低用户与复杂数据库交互的门槛。然而，数据库表结构复杂、字段定义存在歧义以及业务逻辑繁琐，长期以来都是AI处理该类任务的主要障碍。

在这一背景下，Gemini-SQL2的优势尤为突出。根据行业基准测试平台BIRD的最新数据显示，Gemini-SQL2在单模型赛道上达到了80.04%的执行准确率，成功超越了谷歌此前的模型版本。值得关注的是，BIRD评测集包含了来自37个专业领域的95个数据库，总计超过1.2万组问题，不仅模拟了真实的企业环境，还特意加入了脏数据与需要外部知识辅助的测试项，含金量十足。

该模型的应用前景十分广阔。未来，企业员工无需掌握晦涩的代码，只需通过自然语言提问，例如“上季度区域销售流失情况如何”，系统便能自动调取数据并生成精准的分析报告。

尽管外界对该模型的落地充满期待，但截至目前，谷歌尚未公布Gemini-SQL2的具体模型标识、API接口细节或详细技术报告，也未透露哪些产品将率先集成该能力。这一顶尖AI模型后续将如何改变数据分析的作业流程，值得业内持续关注。

via AI新闻资讯 (author: AI Base)

2 小时前

用满 200 刀订阅能吃掉1. 4 万刀算力？大模型巨头正面临严峻的成本风暴

行业分析机构SemiAnalysis最新对OpenAI与Anthropic的订阅方案进行了实测。结果显示，在看似平价的固定月费背后，隐藏着由大模型厂商自行承担的巨额算力补贴缺口。

测试人员通过购买两家公司的各类订阅计划，并持续运行长周期编程和智能体等重型任务，直至触及每周的使用上限。随后按照公开的API价格折算出这些实际使用量对应的理论费用，数字令人震惊。

极限使用拉满算力补贴

测算结果显示，如果用户完全用满OpenAI价格为 200 美元的“ChatGPT Pro 20x”订阅，其对应的API计费最高可达到约1. 4 万美元。而以同样价格定价的Anthropic “Claude Max 20x”方案，在极限使用情况下，理论Token成本也可逼近 8000 美元。

这意味着一小部分重度用户就足以吞噬掉订阅模式下原本有限的利润空间，让厂商陷入严重亏损。对于ChatGPT Plus这类 20 美元的入门订阅，一旦用户利用率超过11.4%，OpenAI就开始在该用户身上亏本。

企业精细化分流成新趋势

在此背景下，以多步、自主调用工具为代表的智能体系统正在推高成本压力，其Token消耗可达到传统单轮对话的千倍级。包括微软、Meta、亚马逊在内的大型企业，已对此前鼓励员工大规模试用AI的做法有所收缩，以控制内部快速膨胀的账单。

为了应对高昂的算力开支，越来越多企业开始采用将复杂问题交由顶级模型、常规办公下放给便宜或开源模型的精细化分流策略。这种任务路由方式最高可将整体AI成本削减95%，同时也迫使大模型服务商在用户体验与高昂的基础设施投入之间艰难寻找平衡。

via AI新闻资讯 (author: AI Base)

3 小时前

OpenAI斥资1. 5 亿美元启动合作伙伴网络，全面加速企业AI转型

全球人工智能巨头OpenAI今日正式宣布推出“OpenAI合作伙伴网络”计划。该项目旨在携手全球合作伙伴，共同构建、销售并交付基于OpenAI技术的创新解决方案，协助各大企业将AI雄心转化为实际成果。为了全力支持这一生态系统的蓬勃发展，OpenAI率先投入了1. 5 亿美元的巨额资金。官方计划通过该网络提供全方位的资源、赋能渠道和技术支持，并在 2026 年底前培养和认证出 30 万名专业顾问。

随着人工智能技术的迅猛发展，企业实现AI价值的瓶颈已经不再是模型本身的能力。相反，如何精准识别应用场景、重塑业务流程以及推动组织内部的变革管理，成为了企业转型落地的核心挑战。

构建全球AI转型生态

OpenAI合作伙伴网络引入了分级激励机制，合作伙伴可根据销售业绩、技术实力以及部署经验，逐步晋升为精选、高级或精英三个级别。随着平台的持续升级，伙伴们未来还能获取Codex、网络安全和智能体等高影响力领域的专业认证。

此外，OpenAI正在面向部分创始合作伙伴试点“前沿部署专家”项目，帮助顶尖技术人员与OpenAI的专属工程团队深度对接。通过这种紧密的协同合作，参与者能够率先接触到前沿的技术蓝图与转型模式，从而将更具原生优势的AI经验注入到客户的实际应用环境中。

多元合作共享AI红利

这个全新的生态系统汇聚了来自系统集成、管理咨询、技术创新和数据处理等多个领域的全球领军企业。目前，包括埃森哲、贝恩咨询、波士顿咨询、麦肯锡以及普华永道在内的多家顶尖机构已首批加入该网络。

在具体实践中，波士顿咨询正协助安捷伦科技加速全业务流程的AI部署，而埃森哲则凭借深厚的行业经验帮助企业重构价值链。OpenAI强调，没有任何一家公司能够独自满足所有市场和客户的需求，只有通过生态化合作才能让AI红利真正走向普惠。

via AI新闻资讯 (author: AI Base)

Before

After