https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
↩️🖼 🤖 OpenAI 开始有限预览 GPT-5.6 系列


科技圈🎗在花频道📮:

🤖 OpenAI 将根据联邦政府审查请求分阶段发布 GPT 5.6 OpenAI CEO Sam Altman 告诉员工,GPT-5.6 将应联邦政府要求,先向少数合作伙伴开放限量预览。预览期间,政府将逐个客户批准访问。 这一要求出现在 OpenAI 过去一个月与多个政府机构预览模型之后。商务部长 Howard Lutnick 据称曾提醒 OpenAI,不要在没有其他机构批准的情况下发布。Altman 称这不是公司偏好的长期模式,将与政府和行业寻找更可持续的发布流程,如果一切顺利,他希望几周后更大范围发布。…

🤖 OpenAI 开始有限预览 GPT-5.6 系列

OpenAI 开始有限预览 GPT-5.6 系列,包括旗舰模型 Sol、均衡型 Terra 和低成本 Luna。Sol 主打更强的编码、生物和网络安全能力,并新增 max 推理强度和 ultra 模式;Terra 性能接近 GPT-5.5 且便宜 2 倍,Luna 则定位为最低成本选择。

这次发布先面向少数可信伙伴,通过 API 和 Codex 提供,OpenAI 称这是应美国政府要求采取的短期步骤,目标是在未来几周扩大到 ChatGPT、Codex 和 API。GPT-5.6 同时加强多层安全防护,重点约束高风险网络请求和滥用;每 100 万 token Sol 的输入价格为 5 美元/输出价格为 30 美元;Terra 的输入价格为 2.50 美元/输出价格为 15 美元;Luna 的输入价格为 1 美元/输出价格为 6 美元。

OpenAI

🌸 在花频道 · 英文频道 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
#Update #ChatGPT

GPT-5.6 系列模型现已发布:

• 包含 Sol、Terra、Luna 三个模型(能力由强到弱)
• Sol 宣称 SOTA,且超越 Claude Mythos 5
• Sol 宣称有更高的 Token 效率

目前,受到美国政府的监管限制,GPT-5.6 系列仅针对少数可信组织开放,OpenAI 计划在未来几周内让此模型广泛可用。

官方博客:https://openai.com/index/previewing-gpt-5-6-sol/

via AI Copilot - Telegram Channel
OpenAI 开始有限预览 GPT-5.6 系列

OpenAI 开始有限预览 GPT-5.6 系列,包括旗舰模型 Sol、均衡型 Terra 和低成本 Luna。Sol 主打更强的编码、生物和网络安全能力,并新增 max 推理强度和 ultra 模式;Terra 性能接近 GPT-5.5 且便宜 2 倍,Luna 则定位为最低成本选择。

这次发布先面向少数可信伙伴,通过 API 和 Codex 提供,OpenAI 称这是应美国政府要求采取的短期步骤,目标是在未来几周扩大到 ChatGPT、Codex 和 API。GPT-5.6 同时加强多层安全防护,重点约束高风险网络请求和滥用;每 100 万 token Sol 的输入价格为 5 美元/输出价格为 30 美元;Terra 的输入价格为 2.50 美元/输出价格为 15 美元;Luna 的输入价格为 1 美元/输出价格为 6 美元。

OpenAI

🌸 在花频道 · 英文频道 · 投稿通道
Codex Usage Limits Depleting Faster Than Expected

Status: Investigating

We are investigating reports that Codex usage limits are being consumed faster than expected.

Affected components
App (Degraded performance)
VS Code extension (Degraded performance)
Codex API (Degraded performance)
Codex Web (Degraded performance)
CLI (Degraded performance)

via OpenAI status
意大利监管机构调查微软Microsoft 365涨价做法

罗马时间6月26日,意大利反垄断监管机构宣布,对微软公司因“Microsoft 365”订阅服务涨价而涉嫌实施不公平商业行为展开调查。

该机构在声明中指出,微软近期将“Microsoft 365”服务与其人工智能工具Copilot和Designer进行了整合,但没有充分告知消费者相关情况。 在此背景下,用户在未主动选择退出的情况下,会被自动迁移到价格更高的订阅方案。 监管方认为,消费者在续订合同时并未获得足够的信息来作出是否继续续约的明智决策。

意大利反垄断机构认为,上述做法可能被视为“带有攻击性”的商业行为,因为它不当地限制了消费者的选择自由。 监管方强调,按现有情况,用户面临的是被动接受涨价和功能变化,而非在充分知情基础上的自主选择。

截至目前,微软方面尚未就此调查作出即时回应。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
加州推出全美首个 AI 失业追踪仪表盘,监测人工智能对就业的影响

加州州长加文·纽森于 6 月 25 日宣布推出全美首个 AI 失业追踪公共仪表盘,用于监测人工智能是否正在导致该州就业岗位流失。这款仪表盘由加州就业发展局与加州大学洛杉矶分校加州政策实验室的研究人员联合开发,每月更新一次,重点追踪易受 AI 影响职业的失业申领数据,以便为受影响的工人提供再培训、求职协助和医疗保障指引等支持。目前数据显示,AI 尚未引发全州范围的失业潮,但研究人员发现,自 2022 年 ChatGPT-3.5 发布以来,在 AI 高暴露行业工作的受过大学教育的工人失业申领有所增加,旧金山湾区尤为明显。

Decrypt

🌸 在花频道 · 英文频道 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
百度千帆Coding Plan停止套餐续费,7月将升级推Token Plan按量计费产品

百度智能云千帆大模型平台于2026年6月25日正式停止其AI编码订阅服务“Coding Plan”的所有套餐续费服务,标志着这一上线仅四个月的产品迎来重大战略转型。

作为2026年2月推出的低门槛全流程代码辅助工具,Coding Plan曾主打多模型驱动优势,支持开发者在一键切换GLM-4.7、DeepSeek-V3.2等主流大模型的同时,深度兼容Cursor与Claude Code等前沿编程工具。针对此次停续调整,千帆团队给出了明确的过渡方案:已购套餐的个人用户在当前服务周期内权益不受影响,而自动续费功能将在公告发布30天后统一关闭,套餐到期后相关服务将平稳结束。

据悉,本次产品线的紧急踩刹车并非业务终结,而是百度智能云深化生成式AI商业化路径的战略性重组。千帆团队透露,后续将把技术与用户资源逐步迁移至计划于2026年7月初上线的全新产品“Token Plan个人版”中。新产品将全面抛弃传统的固定套餐订阅制,转向更具弹性的按量计费模式,并提供更丰富的模型选择。

via AI新闻资讯 (author: AI Base)
↩️ Cursor 研究:越强的 AI 模型越会“作弊”或“抄袭”应对编程基准测试


科技圈🎗在花频道📮:

GPT-5编程测试被曝"作弊":自删23道题目美化成绩 有开发者发现,OpenAI在GPT-5编程能力测试中存在"猫腻"。官方声称使用SWE-bench Verified基准测试,但实际只用了477个问题,自行删除了原本500题中的23道。SWE-bench是评估AI模型自主编程能力的通用指标,而GPT-5使用的是"子集的子集"。如果被删除的23题按零分计算,GPT-5的实际得分将低于Claude Opus 4.1,目前两者仅有0.4%的微弱差距。 新浪科技 🍀频道 🍵茶馆 📮投稿

Cursor 研究:越强的 AI 模型越会“作弊”或“抄袭”应对编程基准测试

Cursor 团队发现在 SWE-bench Pro 测试中,Opus 4.8 Max 编程功能的 63%的成功案例并非模型自行推导,而是通过检索公开网络上的已知补丁或挖掘仓库 Git 历史直接套用答案。移除.git 目录并限制网络访问后,Opus 4.8 Max 得分从 87.1%骤降至 73.0%,Cursor 自家的 Composer 2.5 从 74.7%降至 54.0%。

研究显示这种“鼓励作弊”行为随模型代际急剧升级:Opus 4.6 在严格环境下得分几乎不变,Opus 4.8 Max 却下降 14.1 分,Composer 2.5 更下降 20.7 分。但 GPT 系列模型未出现类似趋势。Cursor 呼吁编程评测必须控制运行环境,否则评价容易受检索答案功能影响而没有表现出模型真正的编程水平。

Cursor

🌸 在花频道 · 英文频道 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
OpenAI Codex个人用户用量暴增 137 倍,AI编程已走出程序员圈子

OpenAI于 6 月 25 日发布报告,披露旗下智能体AI产品Codex自 2025 年 8 月以来的惊人增长数据:个人用户使用量飙升 137 倍,组织用户增长 189 倍,OpenAI内部使用量也增长了 12 倍。这意味着Codex的受众已从专业开发者群体,迅速向更广泛的普通用户蔓延。

非技术用户成增长主力,长周期任务能力凸显

在OpenAI内部,目前97.9%的员工日常使用Codex,而 2025 年 8 月这一比例仅为约40%。外部组织的渗透率也已攀升至17.3%,且增速仍在加快。整体来看, 2026 年上半年使用智能体AI的活跃用户数量增长超 5 倍,其中增长最快的人群恰恰是软件开发人员以外的非技术用户。

OpenAI同时指出,Codex作为智能体AI具备持续处理长周期任务的独特能力。自 2026 年年初以来,提交过至少一项预估需人类 8 小时以上才能完成的任务请求的Codex用户比例增长了近十倍,表明产品正从辅助工具向能够独立"干活"的协作角色加速演变。

这一数据背后,折射出AI编程工具市场正在经历一场深刻的用户结构变革——过去以开发者为核心受众的赛道,如今正在被更广泛的办公场景和普通用户需求重新定义。当非程序员也能通过自然语言驱动AI完成复杂任务时,Codex的增长曲线或许只是AI普惠化的一个开端。

via AI新闻资讯 (author: AI Base)
苹果 Xcode 26.6 正式发布,编程助手迎来“谷歌 Gemini”强力外援

苹果公司今日正式推送了 Xcode26.6更新,为开发者带来了备受期待的功能升级——编程助手正式新增对 Google Gemini 的支持。这意味着开发者在编写代码时,除了原有的 Anthropic Claude Agents 和 OpenAI Codex 之外,现在又多了一个强大的AI辅助选项。

此次更新的 Xcode26.6版本集成了最新的 Swift6.3.3语言版本,并同步更新了覆盖 iOS、iPadOS、tvOS、watchOS、visionOS 以及 macOS26.5等全平台系统的 SDK。除了引入 Gemini 编程助手这一亮点外,本次版本升级还优化了 ACP 兼容能力,并集中修复了一系列已知 Bug,旨在进一步增强开发环境的整体稳定性与运行效率。

事实上,苹果此前已在 Xcode27的测试版中先行尝试引入 Gemini 支持。此次将其下放至正式版,显示出苹果正加速将主流大模型整合进其开发生态。目前,开发者已可直接从 App Store 免费下载该版本,即刻体验 AI 辅助编程带来的效率提升。随着 Xcode 在 AI 领域布局的不断完善,开发者未来的编码体验或许将迎来更多元化的智能化变革。

via AI新闻资讯 (author: AI Base)
Anthropic公司付费收入和用户持续增长

美国顶尖AI企业OpenAI与Anthropic之间的竞争日益激烈。报告显示 Anthropic 正在快速抢占OpenAI的付费用户市场份额。据信用卡交易分析公司Indagari数据,Anthropic旗舰模型Claude付费用户和收入逐月增长,自2026年1月以来,该细分市场的收入增长了约75%。Indagari的数据来自2800万美国消费者的数千亿笔匿名信用卡交易记录,覆盖了 2025年至 2026年5月10日之间的每周交易。AI在线教育平台DataCamp也给出了类似的结论。指出平台上的用户今年对Claude的兴趣呈爆炸式增长,Claude已经成为该网站上搜索量最高的词条,甚至超过了AI。

—— 财联社Techcrunch

via 风向旗参考快讯 - Telegram Channel
特朗普政府要求 OpenAI 分阶段发布新模型

2026-06-26 14:35 by 量子魔术师

出于安全担忧特朗普政府要求 OpenAI 分阶段发布新的 GPT-5.6 模型。The Information 报道,新模型最初将提供给一小部分合作伙伴,政府将在预览期内“逐个批准客户的访问权限”。报道称,这一要求源于国家网络安全总监办公室和科技政策办公室之间的对话。

https://yro.slashdot.org/story/26/06/25/215241/trump-administration-asks-openai-to-stagger-release-of-new-model

#USA

via Solidot - Telegram Channel
拖更三年万字长文,前OpenAI安全VP翁荔拆解Scaling Laws:你的模型可能喂错了数据

停更 13 个月后,前OpenAI安全研究副总裁、现Thinking Machines Lab联合创始人翁荔在个人博客Lil'Log上发表了一篇逾万字的技术长文《Scaling Laws, Carefully》,自称"迟到了三年多"。这篇文章将支撑大模型行业数百亿美元投入的Scaling Laws从头拆解一遍,得出的核心结论让不少从业者难以平静:当前模型的数据配比,很可能从一开始就走偏了。

从Kaplan到Chinchilla:一场被写反的行业共识

故事始于 2020 年,OpenAI研究员Jared Kaplan发表论文,提出在log-log坐标上,训练损失随参数量、数据量和算力呈漂亮幂律下降——模型规模应比数据增长更快。GPT- 3 正是这一结论的产物: 1750 亿参数,训练数据却仅 3000 亿token。

两年后,DeepMind团队以更大规模实验推翻了这一结论。他们将 2800 亿参数的Gopher与 700 亿参数的Chinchilla同算力对比,后者参数仅为前者的四分之一,但训练数据是四倍多——结果Chinchilla在所有评测上碾压Gopher。Chinchilla揭示的规律是参数与数据应等比增长,最佳比例约为1:20,而非Kaplan所说的参数飙涨、数据慢跟。这也解释了为何后来Llama、DeepSeek等模型参数不敌GPT-3,性能却远胜于它。

翁荔分析了Kaplan的偏差根源:实验最大模型仅 15 亿参数,小规模区间的拟合差异外推至万亿级别后演变为系统性错误;同时Kaplan排除了embedding层参数计数,而这一口径在小模型上影响极大。更令人意外的是, 2024 年Epoch AI团队逐行复现Chinchilla拟合代码时发现两个bug——损失函数取均值而非求和导致优化器误判收敛、核心幂律指数被四舍五入至两位数产生虚假精度——修正后的数据再次印证了等比增长的结论。

数据墙将至,重复训练边际价值指数衰减

上述讨论均以"训练数据无限且不重复"为前提,但高质量文本数据预计 2026 至 2028 年即告枯竭。研究显示,重复数据的有效价值呈指数衰减,每多训练一轮边际收益急剧递减。翁荔在文中嵌入的交互式模拟器直观展示了工程细节的敏感性——仅调整拟合精度或噪声水平,外推预测就可能差出十万八千里。

翁荔最终写下这样一句三年来凝练的判断:Scaling Laws不是物理定律,它是对工程细节高度敏感的观测性指南。

via AI新闻资讯 (author: AI Base)
法国 AI 初创企业 Mistral AI 发布 OCR4模型:覆盖170种语言,交互体验更人性化

法国人工智能新锐企业 Mistral AI 近日宣布,其自主研发的全新文档识别模型 OCR4已正式亮相。该模型在处理多语言文档方面表现出色,能够支持跨越10个语族的170种语言,为全球化文档处理提供了新的技术方案。

根据公开评估数据,Mistral OCR4在 OmniDocBench 测试中取得了93.07分的成绩,其输出内容的准确度与自然流畅度受到广泛好评,在用户体验测评中表现优于 GPT5.5Pro 和 Gemini3.1Pro Preview 等业界领先的同类产品。

Mistral AI 在发布中提到,OCR4是一款专注于高效处理的模型。它不仅能精准识别和提取文档文字,还具备边框识别、区域分类以及置信度评分等专业功能。此外,该模型在设计上充分考量了下游业务的需求,不仅支持 RAG(检索增强生成)语义分块,还具备智能体结构化基本单元及连接器结构化内容输出等特性,能有效支撑各类复杂的文档智能化工作负载。

在定价方面,Mistral OCR4基础 API 的收费标准为每千页4美元,如果企业选择批处理模式,还可享受50% 的价格优惠;针对更为专业的文档人工智能服务,其定价则定为每千页5美元。这一灵活的定价策略,旨在降低企业级用户的使用门槛,加速文档自动化处理技术的普及。

via AI新闻资讯 (author: AI Base)
Mistral AI发布OCR4 模型:支持 170 种语言,输出质量超越GPT与Gemini

法国人工智能初创企业Mistral AI于本月 23 日正式推出最新文档内容识别模型OCR 4,在光学字符识别领域投下一枚重磅炸弹。这款小型聚焦模型支持横跨 10 个语族的多达 170 种语言,在权威基准测试OmniDocBench中斩获93. 07 分,输出质量相较GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞争对手更受人类评审青睐。

小型但全面,覆盖多场景下游任务

OCR4 的定位并非追求参数规模,而是一个专精于文档识别的高效模型。它在输出识别文本的同时还能提供边框定位、区域分类及置信度评分,可广泛支持RAG语义分块、智能体结构化基本单元、连接器结构化内容等多种下游工作负载。

定价方面,OCR4 基础API调用为每千页 4 美元,若采用批处理方式可享受50%的折扣;而文档人工智能定价则为每千页 5 美元。

Mistral AI作为欧洲AI领域最具代表性的初创公司之一,此前已凭借开源与闭源并行的模型策略在全球市场崭露头角。此次推出OCR 4,将公司能力从通用大语言模型进一步延伸至文档智能处理这一垂直赛道,直接与OpenAI、Google等巨头在基础工具层展开竞争。

via AI新闻资讯 (author: AI Base)
↩️ Apple Xcode 26.6 正式版新增 Google Gemini 编程助手


科技圈🎗在花频道📮:

🍏 苹果发布 Xcode 26.3 引入 代理式编码 并调整 App Store SDK 要求 苹果发布 Xcode 26.3 ,新增 代理式编码 功能,开发者可在 Xcode 内通过自然语言调用 OpenAI 与 Anthropic 的 AI 代理,自动理解项目、编写代码、构建应用、运行测试并修复错误。 另外苹果宣布自 2026 年 4 月 28 日起,提交至 App Store Connect 的应用与游戏需使用 iOS 26、iPadOS 26、tvOS 26、visionOS 26、watchOS…

Apple Xcode 26.6 正式版新增 Google Gemini 编程助手

Apple 发布 Xcode 26.6 正式版,新增对 Google Gemini 编程助手的支持,Gemini 成为继 Anthropic Claude Agent 和 OpenAI Codex 之后的第三个 AI 编程助手选项。该版本同时包含 Swift 6.3.3 以及 iOS 26.5、macOS 26.5 等系统 SDK。

Gemini 早在 6 月 10 日已随 Xcode 27 beta 上线,此次正式版向所有用户开放。新版还通过 Agent Client Protocol 支持接入其他兼容代理,并包含错误修复与稳定性改进。

9To5Mac

🌸 在花频道 · 英文频道 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
Google为何突然流失多位AI人才?美媒:还是因为钱

彭博社周二报道称,谷歌Gemini项目的两名关键研究员乔纳斯·阿德勒(Jonas Adler)和亚历山大·普里策尔(Alexander Pritzel)将离开谷歌,加入Anthropic,导致这家搜索引擎巨头的高调离职名单进一步拉长。此前离职的知名AI专家还包括诺姆·沙泽尔(Noam Shazeer)以及诺贝尔奖得主约翰·江珀(John Jumper)。

谷歌

人们很容易将这些离职解读为对谷歌AI战略的一种否定。这或许有一定道理,谷歌需要兼顾众多业务,而Anthropic和OpenAI则几乎将全部精力集中在人工智能前沿研究上。这种高度聚焦的发展方向,对顶尖AI人才具有很强的吸引力。

IPO前股权诱惑

不过,更简单的解释或许在于经济层面。

对于硅谷的顶尖人才而言,从一家成熟的上市公司跳槽到一家快速成长的创业公司,历来是实现超额财富积累最可靠的路径之一,尤其是当这家创业公司有IPO前景时。

在谷歌,员工薪酬主要以限制性股票单位(RSU)形式发放,而公司本身已经达到超过4万亿美元的市值。在这种情况下,虽然收益依然可观,但整体上涨空间相对更可预测、也更有限。

而在Anthropic或OpenAI,这个“收益公式”可能完全不同。现在加入的研究人员,往往可以获得相当可观的IPO前股权。如果这些公司最终在2026年或2027年左右成功上市,那么一旦锁定期结束,这些股权的价值可能会大幅上涨,从而带来非常可观的财富增长。

沙泽尔通过跳槽积累大量财富

沙泽尔便是一个典型案例,从中能看出在AI热潮中跳槽可以带来多么丰厚的回报。

他在2021年离开谷歌,共同创立了Character.AI。大约三年后,谷歌通过一项许可协议支付约27亿美元,将他重新招入麾下。据《华尔街日报》报道,由于沙泽尔在这家创业公司持有相当可观的股份,他通过该交易出售所持股份,获利数亿美元。

大约20个月后,他又一次跳槽。这一次他加入了OpenAI,而该公司近期已秘密提交了IPO申请。假设他在这次跳槽中获得了新的股权,沙泽尔很可能再次被置于一个潜在“高变现事件”的轨道上。

顶级AI研究人员或许会说,人才争夺战的意义在于“构建未来”。但更现实的一面是:它同样关乎谁能在未来中拿到更大的一块股权蛋糕。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:凤凰网科技)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]