https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
苹果 Siri 重磅升级:1.2 万亿参数谷歌定制模型“掌脑”,本地运行速度成关键
北京时间 5 月 26 日,据多家媒体援引知情人士消息,苹果并非简单将 Gemini 集成到 Siri 中,而是正在采用一款由谷歌定制的1.2 万亿参数大型语言模型,作为下一代 Siri 核心 overhaul 的“大脑”。
这一规模远超当前主流移动端模型,引发业界高度关注。
模型规模碾压:1.2T vs Gemini 3.5 Flash 300B
据估算,Gemini 3.5 Flash 的参数量约为 3000 亿,而苹果此次采用的定制模型达到1.2 万亿参数,规模显著更大。AIbase分析指出,如此庞大的模型若能高效部署,将为 Siri 带来更强的理解、推理和复杂任务处理能力,尤其在多模态交互和上下文理解方面有望实现质的飞跃。
性能与速度:本地响应是最大考验
尽管模型参数激增,但苹果一贯注重用户隐私与实时性。报道强调,简单查询预计将优先在本地设备上运行。这意味着苹果必须解决大模型在 iPhone 等终端上的高效推理难题——既要保证回答日常问题的速度足够快,又要兼顾功耗和发热控制。
AIbase认为,模型“够大”并不必然等于“够好”。在移动场景下,延迟、能耗和准确率的平衡才是成败关键。苹果是否能在 1.2T 参数模型上实现高效本地 / 混合部署,将直接决定这次 Siri overhaul 的用户体验。
下半年 AI 大战一触即发
随着苹果在 WWDC 上即将展示 Apple Intelligence 与 Gemini 的深度融合,全球 AI 巨头竞赛进入新阶段。未来几个月值得期待的重磅更新包括:
● WWDC:Apple Intelligence 全面亮相,Siri 与 Gemini 定制模型结合
● GPT-5.6:OpenAI 下一代模型进展
● Sonnet 4.8 / Opus 4.8:Anthropic 可能同步迭代
● Gemini 3.5 Pro:谷歌已确认即将推出
AIbase将持续跟踪苹果 Siri 升级进展及大模型在终端侧的落地表现。这场由参数规模、推理速度、隐私保护共同定义的 AI 竞赛,正越来越接近消费者日常使用场景。谁能最终胜出,拭目以待。
via AI新闻资讯 (author: AI Base)
北京时间 5 月 26 日,据多家媒体援引知情人士消息,苹果并非简单将 Gemini 集成到 Siri 中,而是正在采用一款由谷歌定制的1.2 万亿参数大型语言模型,作为下一代 Siri 核心 overhaul 的“大脑”。
这一规模远超当前主流移动端模型,引发业界高度关注。
模型规模碾压:1.2T vs Gemini 3.5 Flash 300B
据估算,Gemini 3.5 Flash 的参数量约为 3000 亿,而苹果此次采用的定制模型达到1.2 万亿参数,规模显著更大。AIbase分析指出,如此庞大的模型若能高效部署,将为 Siri 带来更强的理解、推理和复杂任务处理能力,尤其在多模态交互和上下文理解方面有望实现质的飞跃。
性能与速度:本地响应是最大考验
尽管模型参数激增,但苹果一贯注重用户隐私与实时性。报道强调,简单查询预计将优先在本地设备上运行。这意味着苹果必须解决大模型在 iPhone 等终端上的高效推理难题——既要保证回答日常问题的速度足够快,又要兼顾功耗和发热控制。
AIbase认为,模型“够大”并不必然等于“够好”。在移动场景下,延迟、能耗和准确率的平衡才是成败关键。苹果是否能在 1.2T 参数模型上实现高效本地 / 混合部署,将直接决定这次 Siri overhaul 的用户体验。
下半年 AI 大战一触即发
随着苹果在 WWDC 上即将展示 Apple Intelligence 与 Gemini 的深度融合,全球 AI 巨头竞赛进入新阶段。未来几个月值得期待的重磅更新包括:
● WWDC:Apple Intelligence 全面亮相,Siri 与 Gemini 定制模型结合
● GPT-5.6:OpenAI 下一代模型进展
● Sonnet 4.8 / Opus 4.8:Anthropic 可能同步迭代
● Gemini 3.5 Pro:谷歌已确认即将推出
AIbase将持续跟踪苹果 Siri 升级进展及大模型在终端侧的落地表现。这场由参数规模、推理速度、隐私保护共同定义的 AI 竞赛,正越来越接近消费者日常使用场景。谁能最终胜出,拭目以待。
via AI新闻资讯 (author: AI Base)
Elevated errors for Claude Code in Slack
May 26, 01:56 UTC
Investigating - We are currently investigating this issue.
via Claude Status - Incident History
May 26, 01:56 UTC
Investigating - We are currently investigating this issue.
via Claude Status - Incident History
人工智能巨头OpenAI日前发布了一则引人注目的安全研究员招聘启事。该岗位开出了29. 5 万至44. 5 万美元(约合人民币 214 万至 323 万元)的丰厚年薪,旨在吸引全球顶尖技术人才,为AI系统的递归式自我改进做足准备。
独特选才标准:要求具备良好品位
与传统的纯技术密集型岗位不同,OpenAI在招聘要求中特别注明,应聘者需要具备“良好的品位与策略判断”。这一罕见的表述恰恰反映了安全团队的工作性质,即不仅依赖工程硬实力,更考验人在面对复杂情况时的综合决断力。
公司希望借此培养出能够突破现有思维框架、提前识别尚未完全显现风险的优秀工程师。这意味着从业者需要审慎权衡安全上的利弊得失,合理分配任务优先级,并设计出兼具技术正确性、社会和伦理合理性的高标准方案。
紧盯自动化进程与评估未来演化
该岗位的核心职责并不仅限于构建安全系统,更需要高瞻远瞩地评估这些AI系统未来的演化方向。研究人员需要具备极强的前瞻性,在危机尚未爆发前就制定好应对策略。
此外,入职的研究人员可能还需要负责“追踪技术人员的自动化进程”。这其中就包括了需要严密衡量和评估公司内部人工智能代码工具的实际使用程度,以确保整个技术演进过程处于绝对可控的安全边界之内。
via AI新闻资讯 (author: AI Base)
xAI 推出 Grok Build:进驻终端的“全能 AI 编程智能体”
5 月 25 日,xAI 正式发布了其全新的 AI 编程智能体 Grok Build,现已面向所有 SuperGrok 及 X Premium Plus 订阅用户开启 Beta 测试。这款工具不仅是一个简单的代码助手,而是一款集成在终端(CLI)中的深度工程化智能体,旨在通过自动化流程实现复杂的软件开发任务。
Grok Build 的核心架构与功能
Grok Build 被设计为能够直接嵌入开发者的日常工作流,其核心亮点包括:
● Plan Mode(规划模式): 针对复杂开发任务,Grok Build 可自动生成详细的执行计划。开发者可以在任务执行前查看、评论、修改甚至完全重写该计划,确保每一行变更都经过严格的“评审-批准”链路,产出更安全、可控的代码。
● Imagine 工具集成: 在开发过程中,用户可直接调用 Imagine 工具,利用 AI 生成图片与视频资源,满足项目中的多模态素材需求。
● 命令行(CLI)赋能: ● 高度自动化: 支持通过命令行直接构建复杂的自动化流程或编排器。 ● 并行协作: 对于超大规模任务,Grok Build 能自动拆解并指派多个子智能体(Sub-agents)并行处理,极大提升了处理大型仓库(Repo)效率。 ● 生态兼容: 它能够“开箱即用”地兼容开发者现有的 AGENTS.md、插件、钩子(hooks)、技能及 MCP 服务器,即刻适配现有工作惯例。
“AI+软件工程”的新范式
与传统的 AI 代码助手不同,Grok Build 强调的是工程化的全链路控制。其特有的“ headless mode(无头模式)”允许其在脚本和自动化流程中运行,并全面支持 ACP(Agent Client Protocol,智能体客户端协议),这意味着开发者可以将其作为底层逻辑,构建属于自己的 AI 代理应用。
目前,Grok Build 已在特斯拉的软件开发中展露锋芒,包括 FSD(全自动驾驶) 系统的开发以及即将面世的 Cybercab 自动驾驶车辆项目中,已有资深工程师确认其被广泛应用于解决复杂的工程难题。
如何上手?
现有订阅用户可以通过简单的命令一键安装并使用:
curl -fsSL [https://x.ai/cli/install.sh](https://x.ai/cli/install.sh) | bash
xAI 表示,Grok Build 目前仍处于 Beta 阶段,鼓励用户通过 CLI 输入 /feedback 实时反馈 Bug 或功能需求。随着此次发布的落地,xAI 正加速将 AI 推向工程研发的最前线,试图将开发者从繁重的重复性编码工作中彻底解放。
via AI新闻资讯 (author: AI Base)
5 月 25 日,xAI 正式发布了其全新的 AI 编程智能体 Grok Build,现已面向所有 SuperGrok 及 X Premium Plus 订阅用户开启 Beta 测试。这款工具不仅是一个简单的代码助手,而是一款集成在终端(CLI)中的深度工程化智能体,旨在通过自动化流程实现复杂的软件开发任务。
Grok Build 的核心架构与功能
Grok Build 被设计为能够直接嵌入开发者的日常工作流,其核心亮点包括:
● Plan Mode(规划模式): 针对复杂开发任务,Grok Build 可自动生成详细的执行计划。开发者可以在任务执行前查看、评论、修改甚至完全重写该计划,确保每一行变更都经过严格的“评审-批准”链路,产出更安全、可控的代码。
● Imagine 工具集成: 在开发过程中,用户可直接调用 Imagine 工具,利用 AI 生成图片与视频资源,满足项目中的多模态素材需求。
● 命令行(CLI)赋能: ● 高度自动化: 支持通过命令行直接构建复杂的自动化流程或编排器。 ● 并行协作: 对于超大规模任务,Grok Build 能自动拆解并指派多个子智能体(Sub-agents)并行处理,极大提升了处理大型仓库(Repo)效率。 ● 生态兼容: 它能够“开箱即用”地兼容开发者现有的 AGENTS.md、插件、钩子(hooks)、技能及 MCP 服务器,即刻适配现有工作惯例。
“AI+软件工程”的新范式
与传统的 AI 代码助手不同,Grok Build 强调的是工程化的全链路控制。其特有的“ headless mode(无头模式)”允许其在脚本和自动化流程中运行,并全面支持 ACP(Agent Client Protocol,智能体客户端协议),这意味着开发者可以将其作为底层逻辑,构建属于自己的 AI 代理应用。
目前,Grok Build 已在特斯拉的软件开发中展露锋芒,包括 FSD(全自动驾驶) 系统的开发以及即将面世的 Cybercab 自动驾驶车辆项目中,已有资深工程师确认其被广泛应用于解决复杂的工程难题。
如何上手?
现有订阅用户可以通过简单的命令一键安装并使用:
curl -fsSL [https://x.ai/cli/install.sh](https://x.ai/cli/install.sh) | bash
xAI 表示,Grok Build 目前仍处于 Beta 阶段,鼓励用户通过 CLI 输入 /feedback 实时反馈 Bug 或功能需求。随着此次发布的落地,xAI 正加速将 AI 推向工程研发的最前线,试图将开发者从繁重的重复性编码工作中彻底解放。
via AI新闻资讯 (author: AI Base)
欧洲央行紧急会议应对 Anthropic 新 Claude Mythos 带来的网络安全威胁
近日,欧洲央行召开了紧急会议,讨论因 Anthropic 公司推出的新 AI 模型 Claude Mythos 所引的网络安全隐患。《金融时报》报道,这一会议是在当地时间周二召,主要目应对 Claude Mythos 对全球金融系统所带来的潜在威胁。
Claude Mythos 被认为能够发现金融机构信息系统中的高危漏洞,这让全球监管十分忧虑欧洲央行的副主席兰克・尔德森在采访中指出,网络安全问题已被讨论多年,但随着 AI 技术的发展,解决这些问题的紧迫性愈发明显。他强调,以往的应对措施速度较慢,现在必须加快步伐。
会议上,埃尔德森对欧洲银行未能获得 Claude Mythos 的使用权限表示遗憾,并希望已经使用该模型的美国银行能够他们的经验和信息。特别软件补丁的部署方面,埃尔德森要求银行加快更新速度,因为一旦漏洞被曝光,恶意分很可能会迅速利用这些。
目前,全球众多金融机构已向 Anthropic 申请获得 Claude Mythos 的使用权限,以提高自身的网络安全防御能力。Anthropic 公司表示,虽然大部分使用权限主要授予美国企业,但他们也计划向其他机构提供相关的技术简报,尤其是包括金融委员会和欧盟委员会的高层。
这次临时会议反映出,面对不断变化的技术环境,全球监管机构采取更快、更有效的对措施,以确保体系的安全和稳定。时间的推移,埃尔德森强调,金融机构不能以未获得模型访问权限为借口,必须采取积极措施来防范潜在的网络攻击。
via AI新闻资讯 (author: AI Base)
近日,欧洲央行召开了紧急会议,讨论因 Anthropic 公司推出的新 AI 模型 Claude Mythos 所引的网络安全隐患。《金融时报》报道,这一会议是在当地时间周二召,主要目应对 Claude Mythos 对全球金融系统所带来的潜在威胁。
Claude Mythos 被认为能够发现金融机构信息系统中的高危漏洞,这让全球监管十分忧虑欧洲央行的副主席兰克・尔德森在采访中指出,网络安全问题已被讨论多年,但随着 AI 技术的发展,解决这些问题的紧迫性愈发明显。他强调,以往的应对措施速度较慢,现在必须加快步伐。
会议上,埃尔德森对欧洲银行未能获得 Claude Mythos 的使用权限表示遗憾,并希望已经使用该模型的美国银行能够他们的经验和信息。特别软件补丁的部署方面,埃尔德森要求银行加快更新速度,因为一旦漏洞被曝光,恶意分很可能会迅速利用这些。
目前,全球众多金融机构已向 Anthropic 申请获得 Claude Mythos 的使用权限,以提高自身的网络安全防御能力。Anthropic 公司表示,虽然大部分使用权限主要授予美国企业,但他们也计划向其他机构提供相关的技术简报,尤其是包括金融委员会和欧盟委员会的高层。
这次临时会议反映出,面对不断变化的技术环境,全球监管机构采取更快、更有效的对措施,以确保体系的安全和稳定。时间的推移,埃尔德森强调,金融机构不能以未获得模型访问权限为借口,必须采取积极措施来防范潜在的网络攻击。
划重点:
🌐 欧洲央行召开紧急会议,应 Claude Mythos 模型带网络安全威胁。
🔍 Claude Mythos 揭示数千金融系统漏洞,全球监管机构高度警惕。
⚠️ 欧洲银行未能获得使用权限,急需加快软件补丁部署,以防范攻击。
via AI新闻资讯 (author: AI Base)
报道称Anthropic 即将发布新一代模型 Mythos,或引发安全隐忧
据科技媒体 Testingcatalog 报道,Anthropic 公司似乎正在准备公开其最新模型 Claude Mythos 的预览版。这一消息引起了泛关注,因为 thos 被是公司迄为止最大的 AI 模型之一。
根据消息来源,在 Claude 和 Claude Security 公开版本中,用户曾短暂发现了名为 “claude-mythos-1-preview” 的选项,但随后该选项被撤回。这表明,Anthropic 可能已经进入了模型的上线前测试阶段。Claude Mythos 的开发可以追溯到 4 月 7 日,官方定位其为针对计算机安全任务的前沿模型。与现有旗舰模型 Opus 4. 相比,Myos 在代码理和自主方面有了显著提升。
然而于其强能力,Anth 并未急全面开放 Myos。公司此前告称,这模型能够自动具备专业准的网络攻击手段,发布可能会对数字基础设施带来严重风险。这一潜在胁让许多人对 Mythos 的公开发布充满了担忧。
值得注意的是,部分用户曾在 Code 的公共版本中短暂看到启用 Mythos 的选项,而 Claude Security 中也出现了同名模型。不过,截至目前,Anthropic 尚未正式宣布具体的公开发布时间。
与此同时,Anthropic 确认正在推进为 “Glass” 的新项目,该项目旨在与其他公司联合保护全球关键软件系统防止 AI 动的漏洞利用。该使用尚未的 Claude Mythos 预览版,并已与多达家组织伙伴合作。Anthropic 展示了一个源漏洞面板,用于汇总 thos 预版发现的不同严重等级的漏洞。
via AI新闻资讯 (author: AI Base)
据科技媒体 Testingcatalog 报道,Anthropic 公司似乎正在准备公开其最新模型 Claude Mythos 的预览版。这一消息引起了泛关注,因为 thos 被是公司迄为止最大的 AI 模型之一。
根据消息来源,在 Claude 和 Claude Security 公开版本中,用户曾短暂发现了名为 “claude-mythos-1-preview” 的选项,但随后该选项被撤回。这表明,Anthropic 可能已经进入了模型的上线前测试阶段。Claude Mythos 的开发可以追溯到 4 月 7 日,官方定位其为针对计算机安全任务的前沿模型。与现有旗舰模型 Opus 4. 相比,Myos 在代码理和自主方面有了显著提升。
然而于其强能力,Anth 并未急全面开放 Myos。公司此前告称,这模型能够自动具备专业准的网络攻击手段,发布可能会对数字基础设施带来严重风险。这一潜在胁让许多人对 Mythos 的公开发布充满了担忧。
值得注意的是,部分用户曾在 Code 的公共版本中短暂看到启用 Mythos 的选项,而 Claude Security 中也出现了同名模型。不过,截至目前,Anthropic 尚未正式宣布具体的公开发布时间。
与此同时,Anthropic 确认正在推进为 “Glass” 的新项目,该项目旨在与其他公司联合保护全球关键软件系统防止 AI 动的漏洞利用。该使用尚未的 Claude Mythos 预览版,并已与多达家组织伙伴合作。Anthropic 展示了一个源漏洞面板,用于汇总 thos 预版发现的不同严重等级的漏洞。
via AI新闻资讯 (author: AI Base)
Anthropic模型震动金融圈 欧洲央行紧急开会要求升级网络防御
欧洲央行已召集多家银行于周二召开会议,讨论最新人工智能模型暴露出的网络安全风险,这家中央银行预计将敦促其他银行加快强化IT系统防护的步伐。欧洲央行计划在会上强调Anthropic的Claude Mythos Preview以及类似AI模型揭示了金融系统面临的严重威胁,同时敦促已使用这类最新技术的多家美国银行,与尚未获得相关技术访问权限的欧洲同行共享信息。欧洲央行执行委员会成员弗兰克·埃尔德森告诉媒体,“多年来,我们一直在与银行讨论网络安全的一系列问题,这些问题如今依然存在。但鉴于人工智能的发展速度,这些问题必须更快解决。”
—— 财联社
via 风向旗参考快讯 - Telegram Channel
欧洲央行已召集多家银行于周二召开会议,讨论最新人工智能模型暴露出的网络安全风险,这家中央银行预计将敦促其他银行加快强化IT系统防护的步伐。欧洲央行计划在会上强调Anthropic的Claude Mythos Preview以及类似AI模型揭示了金融系统面临的严重威胁,同时敦促已使用这类最新技术的多家美国银行,与尚未获得相关技术访问权限的欧洲同行共享信息。欧洲央行执行委员会成员弗兰克·埃尔德森告诉媒体,“多年来,我们一直在与银行讨论网络安全的一系列问题,这些问题如今依然存在。但鉴于人工智能的发展速度,这些问题必须更快解决。”
—— 财联社
via 风向旗参考快讯 - Telegram Channel
教宗良十四世于 5 月 25 日发布首份通谕《人类的伟大》(Magnifica humanitas)。在通谕发布仪式上,梵蒂冈打破惯例,邀请人工智能独角兽 Anthropic 联合创始人克里斯托弗·奥拉参加。教皇借此机会与硅谷模型制造者代表同台,直接施加道德约束。
通谕指出,技术从来不是中立的,人工智能必须服务于共同利益,而不应被少数人垄断,以免拉大“数字革命”中的鸿沟。教皇在通谕中痛批埃隆·马斯克与彼得·蒂尔等硅谷领袖推崇的超人类主义愿景,谴责在 AI 研发中将特定人群判定为低效、无用与多余的精英主义倾向。
Vatican News
🌸 在花频道 · 备用频道 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
Elevated error rates on Opus 4.7
May 25, 10:32 UTC
Monitoring - We had an elevated error rate on Opus 4.7 from 6:30 UTC until 10:30 UTC
via Claude Status - Incident History
May 25, 10:32 UTC
Monitoring - We had an elevated error rate on Opus 4.7 from 6:30 UTC until 10:30 UTC
via Claude Status - Incident History
国家标准委发布《AI伦理安全指引1.0》,为大模型落地装上“安全闸”
近日,全国网络安全标准化技术委员会正式发布《人工智能应用伦理安全指引1.0》。这份重磅文件由阿里、华为、深度求索(DeepSeek)等头部企业及科研单位联合起草,标志着我国人工智能伦理安全治理体系从“顶层倡议”正式迈向“技术标准落位”的新阶段。
指引的三大维度:全生命周期安全闭环
《指引》明确将人工智能的生命周期拆解为应用开发、服务提供、应用使用三个关键层面,并针对各环节提出了差异化的安全要求:
● 开发层:源头治理。 明确要求开发者在模型训练数据清理、模型架构安全性设计及算力环境配置中嵌入伦理审查机制。
● 服务层:过程管控。 重点针对当下大模型普遍存在的“AI 幻觉”问题,要求服务提供方必须具备有效的风险监测与管控手段,确保输出内容的真实性与一致性。
● 使用层:用户边界。 为应用终端的合法合规使用划定界限,保护用户隐私,防止技术滥用。
为什么这份《指引》至关重要?
在业内人士看来,这份文件的落地具有深远的产业价值:
1. 责任主体清晰化: 过去,当 AI 出现内容失控或伦理纠纷时,责任往往模糊。该指引通过明确各环节规范,倒逼企业在模型上线前必须履行安全“预验收”责任。
2. 化解“幻觉”黑洞: 针对人工智能输出不可控(幻觉)的行业痛点,《指引》首次从标准层面提出了管控要求,这将直接推动企业研发更稳健、具备事实校验能力的底层模型。
3. 构建安全生态: 阿里、华为、深度求索等企业的参与,体现了行业对“安全是AI发展前提”的共识。这不仅有利于完善国内人工智能治理体系,更提升了中国 AI 企业在全球技术治理话语权中的专业度。
行业影响:从“野蛮生长”向“合规深耕”转型
随着《人工智能应用伦理安全指引1.0》的发布,AI 产业正迎来新的拐点:
● 合规成“入场券”: 对于致力于 AI 应用的企业而言,伦理安全审计将成为项目上线流程中的硬性标准。
● 技术迭代新方向: 能够有效抑制幻觉、具备强大伦理安全保障的底座模型,将比单纯拼参数规模的模型更受市场青睐。
业内普遍认为,这份指引不仅是对当前 AI 治理短板的及时补齐,更是为国内人工智能产业的长期可持续发展夯实了底座。对于广大从业者而言,这意味着 AI 的开发与应用将不再是脱缰的野马,而是在法律与伦理的轨道上,向更高质量的“智能社会”迈进。
via AI新闻资讯 (author: AI Base)
近日,全国网络安全标准化技术委员会正式发布《人工智能应用伦理安全指引1.0》。这份重磅文件由阿里、华为、深度求索(DeepSeek)等头部企业及科研单位联合起草,标志着我国人工智能伦理安全治理体系从“顶层倡议”正式迈向“技术标准落位”的新阶段。
文件核心定位:
该指引是一份原则性、参考性的技术文件,旨在为人工智能产业链上的各主体提供一套可执行的伦理安全框架,以应对当前AI应用中日益突出的安全挑战。
指引的三大维度:全生命周期安全闭环
《指引》明确将人工智能的生命周期拆解为应用开发、服务提供、应用使用三个关键层面,并针对各环节提出了差异化的安全要求:
● 开发层:源头治理。 明确要求开发者在模型训练数据清理、模型架构安全性设计及算力环境配置中嵌入伦理审查机制。
● 服务层:过程管控。 重点针对当下大模型普遍存在的“AI 幻觉”问题,要求服务提供方必须具备有效的风险监测与管控手段,确保输出内容的真实性与一致性。
● 使用层:用户边界。 为应用终端的合法合规使用划定界限,保护用户隐私,防止技术滥用。
为什么这份《指引》至关重要?
在业内人士看来,这份文件的落地具有深远的产业价值:
1. 责任主体清晰化: 过去,当 AI 出现内容失控或伦理纠纷时,责任往往模糊。该指引通过明确各环节规范,倒逼企业在模型上线前必须履行安全“预验收”责任。
2. 化解“幻觉”黑洞: 针对人工智能输出不可控(幻觉)的行业痛点,《指引》首次从标准层面提出了管控要求,这将直接推动企业研发更稳健、具备事实校验能力的底层模型。
3. 构建安全生态: 阿里、华为、深度求索等企业的参与,体现了行业对“安全是AI发展前提”的共识。这不仅有利于完善国内人工智能治理体系,更提升了中国 AI 企业在全球技术治理话语权中的专业度。
行业影响:从“野蛮生长”向“合规深耕”转型
随着《人工智能应用伦理安全指引1.0》的发布,AI 产业正迎来新的拐点:
● 合规成“入场券”: 对于致力于 AI 应用的企业而言,伦理安全审计将成为项目上线流程中的硬性标准。
● 技术迭代新方向: 能够有效抑制幻觉、具备强大伦理安全保障的底座模型,将比单纯拼参数规模的模型更受市场青睐。
业内普遍认为,这份指引不仅是对当前 AI 治理短板的及时补齐,更是为国内人工智能产业的长期可持续发展夯实了底座。对于广大从业者而言,这意味着 AI 的开发与应用将不再是脱缰的野马,而是在法律与伦理的轨道上,向更高质量的“智能社会”迈进。
via AI新闻资讯 (author: AI Base)
价格狂降75%!DeepSeek V4宣告永久保留折扣,登顶全球AI性价比榜首
中国人工智能企业DeepSeek近日正式更新其API文档,宣布旗下旗舰大模型DeepSeek-V4-Pro将实施永久大降价。原本预计于5月31日结束的2.5折限时优惠活动,如今将直接转为永久定价,相当于在原价基础上永久削减了75%的成本。
碾压美系旗舰的绝对优势
第三方权威评估机构Artificial Analysis的最新基准测试数据显示,此次降价让DeepSeek-V4-Pro直接登顶全球AI模型性价比榜首。在执行相同的AI智能指数测试时,该模型的消耗成本仅为268美元。
这一数字对比海外竞品展现出了惊人的成本控制力,其运行开销仅为OpenAI GPT-5.5的十二分之一。面对Anthropic旗下的Claude Opus4.7,其成本优势更是达到了恐怖的十九分之一。
降价不降配的开源新标杆
在价格大幅下调的同时,DeepSeek-V4-Pro在技术性能上依然保持了世界前沿的一线水准。其技术报告表明,该模型在智能体(Agent)能力上获得了显著增强。
尤其在代码构建(Agentic Coding)测评中,它已经达到了目前全球开源模型中的最高水平。这种兼顾顶尖性能与极致性价比的策略,正引领中国AI势力在全球大模型市场掀起新一轮的普惠风暴。
via AI新闻资讯 (author: AI Base)
中国人工智能企业DeepSeek近日正式更新其API文档,宣布旗下旗舰大模型DeepSeek-V4-Pro将实施永久大降价。原本预计于5月31日结束的2.5折限时优惠活动,如今将直接转为永久定价,相当于在原价基础上永久削减了75%的成本。
碾压美系旗舰的绝对优势
第三方权威评估机构Artificial Analysis的最新基准测试数据显示,此次降价让DeepSeek-V4-Pro直接登顶全球AI模型性价比榜首。在执行相同的AI智能指数测试时,该模型的消耗成本仅为268美元。
这一数字对比海外竞品展现出了惊人的成本控制力,其运行开销仅为OpenAI GPT-5.5的十二分之一。面对Anthropic旗下的Claude Opus4.7,其成本优势更是达到了恐怖的十九分之一。
降价不降配的开源新标杆
在价格大幅下调的同时,DeepSeek-V4-Pro在技术性能上依然保持了世界前沿的一线水准。其技术报告表明,该模型在智能体(Agent)能力上获得了显著增强。
尤其在代码构建(Agentic Coding)测评中,它已经达到了目前全球开源模型中的最高水平。这种兼顾顶尖性能与极致性价比的策略,正引领中国AI势力在全球大模型市场掀起新一轮的普惠风暴。
via AI新闻资讯 (author: AI Base)
Antigravity 新增低用量模型并重置付费配额
Antigravity 收到反馈称简单任务仍消耗过多 token,因此正式加入 Gemini 3.5 Flash(Low)作为优化方案。内部测试中,该模型比 Gemini 3.5 Flash(Medium)少生成约 45% 的 token,且 SWE 任务表现普遍优于 Gemini 3 Flash(High)。
与此同步,所有付费计划的 Gemini 配额已全部重置,以保障用户接下来一周的开发用量。
Varun Mohan(@_mohansolo)
🌸 在花频道 · 备用频道 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
Antigravity 收到反馈称简单任务仍消耗过多 token,因此正式加入 Gemini 3.5 Flash(Low)作为优化方案。内部测试中,该模型比 Gemini 3.5 Flash(Medium)少生成约 45% 的 token,且 SWE 任务表现普遍优于 Gemini 3 Flash(High)。
与此同步,所有付费计划的 Gemini 配额已全部重置,以保障用户接下来一周的开发用量。
Varun Mohan(@_mohansolo)
🌸 在花频道 · 备用频道 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
全球Token消耗量持续攀升 DeepSeek大模型登顶调用榜
在 AI Agent等应用带动下,全球词元消耗量进一步攀升。根据 OpenRouter 最新数据测算,上周(18日至24日)全球AI大模型总调用量为28.9万亿Token,较此前一周增长7.4%。调用量已连续五周上涨,大模型调用需求仍在持续释放。其中,上榜的AI大模型中,中国AI大模型周调用量达9.22万亿Token,环比增长19.89%;同期美国AI大模型周调用量为4.93万亿Token,环比增长16.27%。中国大模型周调用量连续四周超过美国并稳居全球首位。截至目前,DeepSeek-V4-Flash 已登顶OpenRouter全球AI大模型调用榜。
—— 财联社
via 风向旗参考快讯 - Telegram Channel
在 AI Agent等应用带动下,全球词元消耗量进一步攀升。根据 OpenRouter 最新数据测算,上周(18日至24日)全球AI大模型总调用量为28.9万亿Token,较此前一周增长7.4%。调用量已连续五周上涨,大模型调用需求仍在持续释放。其中,上榜的AI大模型中,中国AI大模型周调用量达9.22万亿Token,环比增长19.89%;同期美国AI大模型周调用量为4.93万亿Token,环比增长16.27%。中国大模型周调用量连续四周超过美国并稳居全球首位。截至目前,DeepSeek-V4-Flash 已登顶OpenRouter全球AI大模型调用榜。
—— 财联社
via 风向旗参考快讯 - Telegram Channel
谷歌 CEO 皮查伊:坦诚承认编程领域落后,AI 搜索转型将采取“稳健策略”
谷歌 I/O 大会落幕后,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)做客知名科技播客《Hard Fork》,就大模型竞争、搜索模式变革及 AI 安全等核心问题进行了深度对话。这是谷歌在 AI 竞赛中面对多重挑战背景下的一次罕见坦诚交流。
核心观点概览
● 模型评估: 谷歌在整体智能和多模态能力上处于行业前沿,但在代理式编程(agentic coding)和处理复杂长周期任务上,目前确实落后于竞品。
● 搜索变革: 谷歌不会激进地全面切换至 AI 模式。搜索链接与来源将长期保留,订阅与广告结合的商业模式在 AI 时代依然稳健。
● 智能体推广: AI 智能体(如即将发布的 Spark)将采取“分步推进”策略,重点在于防范边界安全和越界行为,以防范用户产生“退缩心理”。
● 算力逻辑: 谷歌持续向竞争对手开放 TPU 访问权限,旨在通过规模经济和生态协作,保持在硬件前沿的领先地位。
● AGI 预警: 随着近两年技术的爆发式演进,实现 AGI 的预期节点正在加速靠近。即使短期未达终点,未来三年的技术能力也将出现代际跃升,社会必须提前做好准备。
访谈精选:关于竞争、焦虑与未来
1. 关于“落后”的坦诚:承认编程短板
针对外界质疑,皮查伊直言不讳地表示:“我们的模型在文本、音频和通用推理上极具竞争力,但在代理式编程和指令遵循上确实稍逊一筹。”他将编程视为谷歌必须坚守的“核心前沿”,并透露团队正在通过后训练(post-training)迅速修复 Gemini 3.5 Flash 出现的性能退化问题。他认为,当前这个领域“30 到 60 天就仿佛跨越了五年”,竞争格局瞬息万变。
2. 关于搜索:不会“撕掉创可贴”
面对“何时取消经典搜索界面”的提问,皮查伊强调了“引导用户”的重要性。他表示,谷歌将采取有条不紊的渐进策略,而非激进切换。他指出,用户依然需要搜索链接这种高效的连接方式,这不仅仅是产品习惯,更是信息验证的刚需。
3. 关于焦虑:技术变革的必然阵痛
当谈及公众对 AI 的抵制情绪时,皮查伊展现了作为管理者的审慎。他认为,人类的进化速度确实无法完全跟上技术演进的惊人速度,产生焦虑是“自然的、合理的”。但他指出,AI 带来的积极影响(如医疗放射科的工作效率提升)被低估了,他不认同过于确定的悲观预测,但也强调社会必须参与并表达偏好,以引导技术向善。
4. 关于 AGI:正处于演进的关键节点
对于“奇点”是否到来,皮查伊表示,向 AGI 迈进是必然趋势。虽然他避开了给出一个具体的日期,但他明确承认,过去一两年的技术进展速度已经超出了他原有的预期,AGI 的实现节点比预想的要近。他特别强调:“公众不应因为认为 AGI 尚需时日就放松准备。”
市场解读:谷歌的守成与进取
皮查伊此次访谈透露出一种明确的信号:谷歌正在经历从“全能型选手”到“聚焦差异化竞争”的转变。
● 在硬件端: 谷歌维持了其作为 AI 算力“军火商”的地位,通过开放 TPU 换取技术迭代的节奏。
● 在产品端: 面对 Anthropic 和 OpenAI 在编程工具(如 Cursor 联动)上的先发优势,谷歌正表现出极强的反思与追赶姿态。
● 在信任端: 谷歌在智能体产品上的“透明度”策略,暗示其深知 AI 落地最大的敌人不是技术瓶颈,而是用户的“不信任感”。
此次访谈不仅是谷歌对外界疑虑的一次回应,更像是一次对全行业的提醒:在人工智能这场深远的变革中,没有任何一家公司能永远坐在领先的位置上,唯有通过不断的技术迭代与深刻的社会应对,才能在接下来的三年中立于不败之地。
via AI新闻资讯 (author: AI Base)
谷歌 I/O 大会落幕后,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)做客知名科技播客《Hard Fork》,就大模型竞争、搜索模式变革及 AI 安全等核心问题进行了深度对话。这是谷歌在 AI 竞赛中面对多重挑战背景下的一次罕见坦诚交流。
核心观点概览
● 模型评估: 谷歌在整体智能和多模态能力上处于行业前沿,但在代理式编程(agentic coding)和处理复杂长周期任务上,目前确实落后于竞品。
● 搜索变革: 谷歌不会激进地全面切换至 AI 模式。搜索链接与来源将长期保留,订阅与广告结合的商业模式在 AI 时代依然稳健。
● 智能体推广: AI 智能体(如即将发布的 Spark)将采取“分步推进”策略,重点在于防范边界安全和越界行为,以防范用户产生“退缩心理”。
● 算力逻辑: 谷歌持续向竞争对手开放 TPU 访问权限,旨在通过规模经济和生态协作,保持在硬件前沿的领先地位。
● AGI 预警: 随着近两年技术的爆发式演进,实现 AGI 的预期节点正在加速靠近。即使短期未达终点,未来三年的技术能力也将出现代际跃升,社会必须提前做好准备。
访谈精选:关于竞争、焦虑与未来
1. 关于“落后”的坦诚:承认编程短板
针对外界质疑,皮查伊直言不讳地表示:“我们的模型在文本、音频和通用推理上极具竞争力,但在代理式编程和指令遵循上确实稍逊一筹。”他将编程视为谷歌必须坚守的“核心前沿”,并透露团队正在通过后训练(post-training)迅速修复 Gemini 3.5 Flash 出现的性能退化问题。他认为,当前这个领域“30 到 60 天就仿佛跨越了五年”,竞争格局瞬息万变。
2. 关于搜索:不会“撕掉创可贴”
面对“何时取消经典搜索界面”的提问,皮查伊强调了“引导用户”的重要性。他表示,谷歌将采取有条不紊的渐进策略,而非激进切换。他指出,用户依然需要搜索链接这种高效的连接方式,这不仅仅是产品习惯,更是信息验证的刚需。
3. 关于焦虑:技术变革的必然阵痛
当谈及公众对 AI 的抵制情绪时,皮查伊展现了作为管理者的审慎。他认为,人类的进化速度确实无法完全跟上技术演进的惊人速度,产生焦虑是“自然的、合理的”。但他指出,AI 带来的积极影响(如医疗放射科的工作效率提升)被低估了,他不认同过于确定的悲观预测,但也强调社会必须参与并表达偏好,以引导技术向善。
4. 关于 AGI:正处于演进的关键节点
对于“奇点”是否到来,皮查伊表示,向 AGI 迈进是必然趋势。虽然他避开了给出一个具体的日期,但他明确承认,过去一两年的技术进展速度已经超出了他原有的预期,AGI 的实现节点比预想的要近。他特别强调:“公众不应因为认为 AGI 尚需时日就放松准备。”
市场解读:谷歌的守成与进取
皮查伊此次访谈透露出一种明确的信号:谷歌正在经历从“全能型选手”到“聚焦差异化竞争”的转变。
● 在硬件端: 谷歌维持了其作为 AI 算力“军火商”的地位,通过开放 TPU 换取技术迭代的节奏。
● 在产品端: 面对 Anthropic 和 OpenAI 在编程工具(如 Cursor 联动)上的先发优势,谷歌正表现出极强的反思与追赶姿态。
● 在信任端: 谷歌在智能体产品上的“透明度”策略,暗示其深知 AI 落地最大的敌人不是技术瓶颈,而是用户的“不信任感”。
此次访谈不仅是谷歌对外界疑虑的一次回应,更像是一次对全行业的提醒:在人工智能这场深远的变革中,没有任何一家公司能永远坐在领先的位置上,唯有通过不断的技术迭代与深刻的社会应对,才能在接下来的三年中立于不败之地。
via AI新闻资讯 (author: AI Base)