https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
算力提速关键突破:北大与 DeepSeek 联合开源大模型推理框架 DSpark

人工智能推理效率的瓶颈,正在迎来新的技术突破。6月28日,北京大学与深度求索(DeepSeek)正式宣布联合推出并开源大模型推理加速框架——DSpark,旨在解决大语言模型在高并发推理场景下,因频繁执行前向计算而导致的响应延迟与算力浪费难题。

在大语言模型的标准自回归生成流程中,系统每输出一个词元都需要消耗完整的算力资源,这直接限制了对话的实时响应速度。虽然推测解码是目前行业的主流提速手段,但传统方案存在明显短板:简单模型串行生成耗时较长,而并行模型在处理长序列文本时,往往会出现候选接受率下降的问题,导致大量算力被无效消耗。

针对这些痛点,DSpark 创新性地引入了双重优化机制。在候选生成阶段,它采用半自回归架构,通过并行主干网络一次性输出高质量的基础特征,并辅以轻量化模块优化文本逻辑,仅需两层 Transformer 结构即可达到优于五层并行模型的表现,在速度与质量之间取得了巧妙平衡。在验证调度层面,框架引入了置信度调度验证机制,由硬件感知前缀调度器实时判断算力负载,优先处理可靠性高的文本片段,从而最大程度减少无效计算。

经通义千问3、Gemma4等主流模型在代码编写、数学推理及日常对话等多场景下的严格测试,DSpark 的表现十分亮眼。相较于 Eagle3和 DFlash 两类行业主流基线模型,其单轮有效生成长度具备明显优势,尤其在长序列生成任务中,有效缓解了候选有效率衰减的难题。

工程化落地层面,研发团队进行了深度系统级优化,包括采用序列打包降低内存消耗、设计异步调度模式消除 GPU 流水线卡顿,并确保了对主流 CUDA 硬件生态的兼容。目前,DSpark 已率先落地于 DeepSeek-V4-Flash 与 DeepSeek-V4-Pro 预览版服务引擎。实测数据显示,无论在何种响应速度标准下,系统整体吞吐量均实现了跨越式增长。

据悉,深度求索已在 GitHubDeepSpec项目中开源了 DSpark、DFlash 及 Eagle3的全套训练代码、模型权重及评估工具。这一举措将大幅降低行业高性能推理服务的部署成本,为大模型的低成本普及提供了一套切实可行的技术范式。

via AI新闻资讯 (author: AI Base)
AI 开启打工新模式:惠普与 OpenAI 升级战略合作

企业转型往往始于微小的尝试,进而引发颠覆性的变革。全球科技巨头惠普公司在成功开展一系列跨领域试点项目后,宣布正式扩大与 OpenAI Frontier 的战略合作伙伴关系。这项深度合作旨在全球范围内提升客户体验,并全面加速其内部的运营转型。

其实早在几个月前,惠普就已经开始测试这一前沿平台,并迅速取得了令人瞩目的成效。在试点期间,有软件工程师利用该 AI 模型在短短几周内高效处理了上百个合并请求,大大缩短了开发周期。同时,安全团队也借助该技术在一天内修复了多个系统漏洞,将原本需要耗费长达一个月的工作量进行了极致压缩。

从试点跨越到全面部署

随着人工智能工具从实验阶段完美融入日常工作流程,惠普开始将其作为企业级的统一运营平台。Frontier 平台不仅能帮助团队清晰掌握运行中的程序与上下文,还能有效管理操作并精确评估产出结果。这种全新的运营模式,成功推动了企业工作从早期的概念验证稳步走向真正的生产阶段。

在具体的业务应用中,该平台将全面赋能惠普的定价、门店以及客户支持等关键工作流。鉴于惠普在全球拥有庞大的合作伙伴生态,AI 智能体将提供全天候的运营指导,大幅缩短信息流转到实际行动的时间。这种全方位的智能支持,不仅能显著提升用户的整体满意度,还能有效减轻人工团队的操作负担。

构建智能驱动的运营层

在备受关注的网络安全领域,惠普团队通过智能化工具主动修复关键漏洞,每周成功释放了数十个小时的人力产能。在 Frontier 平台完善的权限控制与安全治理下,企业能够更安心地释放人力资源,投入到更具创造性的核心任务中。

通过这次广阔的战略合作,AI 正在成为惠普全公司开展各项工作时不可或缺的全新协作层。凭借强大的执行能力与治理规范,这套由智能驱动的运营模型正在助力惠普实现从早期成效到企业级转型的华丽蜕变。

via AI新闻资讯 (author: AI Base)
绕开西方高昂算力 Coinbase 核心业务转向中国模型 GLM 与 Kimi

加密货币交易所 Coinbase 宣布已将公司核心业务转向使用更具成本效益的中国人工智能模型(如 GLM5.2和 Kimi2.7),此举在大幅提升代币使用量的同时,成功将公司 AI 支出削减了一半。Coinbase 首席执行官布莱恩·阿姆斯特朗(Brian Armstrong)透露,尽管开发者仍保留模型自主选择权,但全新落成的自动路由系统已能根据任务类型、价格及缓存潜力智能分发请求,将缓存命中率从5% 激进提升至60%。

这一战略转型迅速在西方科技界引发连锁反应。初创公司 Lindy 的首席执行官近期已转向使用 Deepseek v4,而云计算巨头 Snowflake 亦在密集测试中国模型,将其作为 OpenAI 和 Anthropic 的高性价比替代方案。此举直接将竞争压力传导至正处于上市筹备期的西方头部 AI 实验室,对依赖高客单价维持增长预期的估值体系构成了严峻的压力测试。

伴随 GPT-5.x-Thinking 与 Opus4.5等高算力推理模型推向市场,企业对代币(Token)的消耗量正呈现爆发式增长。在亚马逊、Meta 等大厂默许员工无上限消耗代币的“代币最大化”趋势下,Coinbase 引入了更为理性的问责机制,要求 AI 投入必须与实际业务产出挂钩。

目前,OpenAI 与 Anthropic 之间的价格战已隐隐打响,OpenAI 针对性推出的旗舰模型 GPT-5.6-Sol 虽深陷软件测试作弊争议,但其在维持与前代同等定价的同时,展现出了超越 Claude Fable 和 Mythos 的代币效率。在多方势力的裹挟下,全球大模型市场正加速从单纯的“技术军备竞赛”走向更为残酷的“工程效率与商业定价对决”。

via AI新闻资讯 (author: AI Base)
马斯克披露 Grok 4.5 进展:SpaceX 与特斯拉率先开启内部“练兵”

近日,埃隆·马斯克在其社交平台上宣布,最新一代大语言模型 Grok 4.5 已在 SpaceX 和特斯拉的内部环境中启动私测。这一动作意味着,该模型正从实验室走向复杂的实际应用场景。

据马斯克透露,Grok 4.5 的技术底座是拥有 1.5 万亿参数的 V9 模型。为了进一步强化其逻辑与处理能力,研发团队在后续的补充训练中,特意引入了当前 AI 编程领域的热门工具 Cursor 的数据。这种针对性的训练策略,显然意在提升模型在代码编写与复杂任务处理上的精准度。

在外界关注的性能表现方面,Grok 4.5 的早期评测数据相当亮眼。测试显示,该模型的综合能力已逼近,甚至在部分维度上有望超越 Anthropic 目前的旗舰产品 Claude Opus。目前,研发团队正通过强化学习(RL)持续对模型进行调优,并不断完善配套的“Grok Build”测试基准,确保其在各种压力测试下的稳定性。

马斯克同时释放了一个明确的信号:SpaceX 的大模型研发节奏将进一步提速。他表示,在今年余下的时间里,SpaceX 将保持“每月发布一款全新模型”的极高迭代频率,所有模型均将从头开始训练。这种高强度的技术演进,不仅展现了马斯克在 AI 领域持续投入的决心,也预示着大模型赛道的竞争即将进入更加频繁的“肉搏战”时代。

via AI新闻资讯 (author: AI Base)
惠普与 OpenAI 达成战略合作,加速布局 AI 智能体平台 Frontier

惠普公司于近日宣布,正式与 OpenAI 达成战略合作伙伴关系。根据双方协议,惠普将在全球业务中全面部署 OpenAI 的“Frontier”平台,意在通过 AI 智能体技术推动企业的数字化转型与增长计划。

Frontier 是 OpenAI 在今年2月推出的企业级智能体平台。它打破了传统 AI 应用局限于单一场景的限制,旨在为企业提供构建、部署和管理 AI 智能体的一站式解决方案。该平台赋予了智能体更具实操性的技能,包括跨业务的共享上下文、员工入职培训、反馈式学习以及明确的安全权限边界,从而使团队能够从孤立的 AI 使用案例,转向跨业务协同的深度合作。

惠普此次选择部署 Frontier,核心看重的是其灵活的集成能力。Frontier 支持与现有系统平滑对接,无需企业强制重新部署或改变数据格式。这意味着惠普可以将现有的业务数据、应用程序以及此前已部署的智能体与新平台直接融合,实现资源的无缝整合。

从使用体验来看,这种架构具备极高的自由度。AI 助手将不再受限于特定的界面或应用程序,无论是通过 ChatGPT 进行交互、运行 Atlas 工作流,还是直接在业务软件中操作,智能体都能协同工作。这种平台化的布局,不仅将显著优化惠普的内部运营流程,也将通过更智能的交互方式,全面提升客户服务体验。

目前,惠普已与 Intuit、Oracle、State Farm 等企业一道,成为首批采用 Frontier 平台的领跑者。随着该平台的全面落地,惠普的业务体系有望在 AI 智能体的驱动下,进一步加速向智能化、自动化转型。

via AI新闻资讯 (author: AI Base)
美媒:智谱GLM-5.2漏洞挖掘能力达到Mythos水平

中国大模型公司智谱AI(Z.ai)近日发布开源权重模型GLM-5.2。据海外科技媒体The Verge报道,多位研究人员认为,GLM-5.2在部分漏洞挖掘和网络安全测试场景中的表现,已经能够与Anthropic旗下先进模型Mythos相媲美,显示出中国AI模型在专业能力领域正快速缩小与美国头部模型的差距。

报道称,尽管GLM-5.2在通用任务能力上仍落后于Anthropic和OpenAI的旗舰模型,但在漏洞发现、网络安全分析等特定任务领域,其表现已接近国际领先水平。一些研究人员认为,中国AI模型与美国顶级模型之间的能力差距正在明显收窄。

这一进展也引发了美国政府对先进AI技术扩散风险的持续关注。报道提到,美国政府近年来持续限制中国获取Anthropic的Mythos、Fable等先进模型,以及相关高性能计算硬件资源。美国政府认为,具备漏洞识别和网络攻击分析能力的先进AI模型,可能带来国家安全层面的风险。

与此同时,OpenAI近期发布的GPT-5.6同样因其在网络安全和漏洞研究领域的潜在能力而受到关注,并对部分功能采取了限制访问措施。

值得关注的是,GLM-5.2采用开源权重(Open Weight)模式发布,用户可以在公开可获得的硬件平台上进行部署和运行。业内观点认为,这种开放策略能够提升模型的研究和应用灵活性,但也可能增加被恶意行为者滥用的风险。

此次GLM-5.2在网络安全领域获得国际关注,也被视为中国大模型在垂直专业能力方向取得的重要进展之一。与此同时,围绕先进AI模型开放程度、安全治理以及国家竞争力的讨论,仍在持续升温。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:凤凰网科技)
GLM-5.2漏洞挖掘能力达到Mythos水平

中国大模型公司智谱AI(Z.ai)近日发布开源权重模型GLM-5.2。多位研究人员认为,GLM-5.2在部分漏洞挖掘和网络安全测试场景中的表现,已经能够与Anthropic旗下先进模型Mythos相媲美,显示出中国AI模型在专业能力领域正快速缩小与美国头部模型的差距。尽管GLM-5.2在通用任务能力上仍落后于Anthropic和OpenAI的旗舰模型,但在漏洞发现、网络安全分析等特定任务领域,其表现已接近国际领先水平。一些研究人员认为,中国AI模型与美国顶级模型之间的能力差距正在明显收窄。这一进展也引发了美国政府对先进AI技术扩散风险的持续关注。

—— 凤凰网科技The Verge

via 风向旗参考快讯 - Telegram Channel
在美国限制AI访问权限后 奥地利敦促欧洲引入Anthropic

奥地利已提议,欧盟应考虑在欧盟境内引入人工智能公司Anthropic,以反制美国阻止外籍人士使用该公司最先进AI模型的举措。在奥地利政府公开的一封致欧盟技术事务专员汉娜·维尔库宁的信件中,奥地利数字化国务秘书亚历山大·普罗尔写道,确保欧洲不被隔绝于重大创新之外至关重要。

“让我们共同探讨Anthropic在欧盟内部进行战略性布局及参与的可能性。我们将为其提供法律确定性、市场准入、资本支持,以及一套契合该公司的价值观体系。”普罗尔在信中写道。

他并未说明将如何落实这一举措,并承认外界可能会对这一构想的可行性抱有怀疑态度。

“真正的问题不在于这是否容易实现,”普罗尔写道,“问题在于,我们欧洲人是否准备好成为自身技术未来的缔造者,还是仅仅满足于做其他地方所作出决策的执行者。”

本月早些时候,欧盟委员会提出了一系列旨在提振本土云计算、人工智能和半导体产业、减少对美国大型科技公司依赖的法案,此举无视了美国政府针对该集团打压其科技行业的批评。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
苹果公司又一位高管跳槽至OpenAI公司

苹果视觉产品业务副总裁 Paul Meade 将于下周离职,加入OpenAI公司。其将负责组建OpenAI硬件部门,并领导一系列AI硬件设备的研发。Meade在苹果任职期间负责Vision Pro 头显的硬件工程工作长达七年,同时也一直领导公司的智能眼镜项目。他于2017年加入苹果视觉产品团队,此前曾参与iPad和iPhone的研发;加入该团队数年后,他开始负责整个团队的硬件工程业务。Meade 离职后,苹果Vision Pro团队的创始成员之一弗莱彻·罗思科普夫将接手 Meade 的大部分工作。Meade此次离职的原因,在于约翰·特纳斯即将出任苹果CEO。后者目前担任硬件工程高级副总裁,并将于9月1日接替库克。

—— 财联社

via 风向旗参考快讯 - Telegram Channel
🤖 Google 限制 📱 Meta 使用 Gemini:AI 算力需求超出供应能力

Google 已限制 Meta 对其 Gemini AI 模型的使用,因 Meta 购买的算力需求超出 Google 可供给能力。据知情人士称,Google 约在今年 3 月告知 Meta 无法提供其拟购买的全部 Gemini 容量,相关限制至今有效,已干扰并延迟 Meta 部分内部 AI 项目。Meta 因此鼓励员工更高效使用 AI tokens,并加速转向自研模型。

这反映出 AI 行业算力瓶颈正加剧。Google 本月早些时候与 SpaceX 签署每月 9.2 亿美元的算力租赁协议以扩充容量;CEO Sundar Pichai 在 4 月财报会上也承认公司“近期算力受限”。Meta 自身无云业务,正大力自建数据中心,并承诺到 2028 年在美国投资 6000 亿美元。知情人士称,Meta 近期开始优先采用新的 Muse Spark 模型,以降低对部分外部模型的依赖。

Financial Times

🌸 在花频道 · 茶馆水群 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
由于算力紧张谷歌限制了Meta的Gemini使用量

在Meta寻求超出其竞争对手谷歌所能提供的计算能力后,谷歌限制了Meta对其Gemini人工智能模型的使用。这再次印证了即使是全球最大谷歌在3月份左右告知Meta,无法提供该公司想要购买的全部Gemini计算能力。此举扰乱并延误了Meta的一些内部人工智能项目。由于限制目前仍然有效,加上Meta正在大力推进人工智能成本控制,Meta已鼓励员工更有效地使用Token。一位知情人士表示,其他几家谷歌客户也受到了这些限制的影响,但程度较轻。该人士称,Meta受到的影响尤为严重,因为其对谷歌模型的需求异常高。这些限制表明,Meta 对 Gemini 等竞争对手模型的依赖程度很高。这也再次印证了,即使是全球最大的人工智能提供商也面临着基础设施方面的限制。

—— 金融时报

via 风向旗参考快讯 - Telegram Channel
↩️ 中国 AI 在网络安全漏洞检测上追平 Anthropic Mythos,美国限制政策遭批适得其反


科技圈🎗在花频道📮:

智谱创始人称旗下模型或可在明年一季度前达到“Mythos 级别” 有用户评估智谱 GLM-5.2 大约相当于 Claude Opus 4.7-4.8 水平,并据此推断中美 AI 模型整体差距约 7 个月。该用户还以 Anthropic 的 Mythos(Fable)为参照,预计中国厂商达到相关级别的模型可能在 2026 年 11 至 12 月。 马斯克在该讨论下回复“Probably Q1”,可以解读为他认为相关时间点在 2027 年第一季度;智谱创始人唐杰则直接回应“won’t take that long”,表示进度会更快。…

中国 AI 在网络安全漏洞检测上追平 Anthropic Mythos,美国限制政策遭批适得其反

中国智谱 AI 本月发布的开源模型 GLM-5.2 在软件漏洞检测上已追平美国顶尖水平。安全公司 Semgrep 测试显示,GLM-5.2 部分基准超越 Anthropic 5 月发布的 Claude Opus 4.8,经调优后可匹敌其最强模型 Mythos;360 安全公司周三也发布了号称比肩 Mythos 的漏洞检测工具"屠龙锋"。GLM-5.2 已跻身全球使用量前十,任何人都可下载运行。

美国政府却在收紧本国模型:OpenAI 周五因安全顾虑限制了 GPT-5.6 的访问,Anthropic 一款通用模型被关闭逾两周,连国家安全局也一度被挡在门外,周五才部分恢复 Mythos 5 对受信实体的访问。批评者认为,封禁美国模型却允许对华出口 AI 芯片是"送礼给中国",正推动全球企业转向更便宜的中国开源模型,反而损害美国 AI 产业。

The Wall Street Journal

🌸 在花频道 · 茶馆水群 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]