https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
美议员希望禁止AI公司出售你的健康数据

美国一项新提案将禁止向数据经纪商出售美国人的健康和位置信息 —— 包括人们向诸如ChatGPT或Claude等人工智能聊天机器人透露的信息。在接下来的几周内,参议员伊丽莎白·沃伦和众议员玛丽·盖伊·斯坎伦计划推出一项更适应人工智能时代的《健康与位置数据保护法》新版本。该法案的先前版本于2022年6月首次提出,禁止数据经纪商收集和出售健康与位置数据。四年后,它被扩大至禁止其他公司向经纪商出售此类数据,并明确涵盖了输入到AI系统中的数据。法案将要求美国联邦贸易委员会在 180天内制定规则,并允许联邦贸易委员会、州总检察长和受影响的个人提起诉讼以强制执行该法案。

—— Theverge

via 风向旗参考快讯 - Telegram Channel
Gemini个性化AI生图向美国免费用户开放

谷歌公司周一宣布,Gemini应用现正向更广泛的用户群体提供其由Nano Banana驱动的个性化图像生成功能。从今天开始,美国所有符合条件的用户均可免费使用该功能,这项服务此前仅对Plus、Pro和Ultra订阅用户开放。谷歌最初在四月份宣布,Gemini的个人智能功能将获得Nano Banana驱动的图像生成能力,允许用户创建反映其独特兴趣的图像。这意味着图像可以根据Gemini对你喜好和偏好的理解来生成,而无需你在提示词中指明它们。Gemini利用来自你Google账户关联服务的数据 —— 例如Gmail、谷歌相册、YouTube和搜索——来实现这一点。

—— Techcrunch

via 风向旗参考快讯 - Telegram Channel
打破低价神话?DeepSeek V4 下月上线将引入峰谷定价机制

国内大模型领头羊DeepSeek近日向用户发出升级提醒,宣布其全新一代DeepSeek V4 正式版计划于 7 月中旬上线。备受市场关注的是,新版本在带来多项功能优化和性能提升的同时,将首次引入精细化的峰谷时段定价机制。

高峰期API调用费翻倍

根据官方公布的邮件信息,北京时间每日的9: 00 至12: 00 以及14: 00 至18: 00 被正式划定为网络高峰时段。在这些时段内,开发者和企业调用API接口的价格将调整为平时的 2 倍。

虽然高峰期价格翻倍对高频接入的AI应用毛利率有一定影响,但由于此前该模型曾经历过一次大幅度的永久性降价,其基础资费已经极低。因此,即便在翻倍后的高峰时段,DeepSeek V4 的整体调用成本依然远低于海外头部前沿模型。

全球企业开启精打细算时代

行业分析指出,此次调整并非意味着DeepSeek放弃了广受欢迎的低价路线,而是其算力资源精细化运营的开始。目前,多款中国大模型凭借超高的性价比,正在国际市场上展现出极强的市场竞争力。

随着海外各大AI工具的计费模式向Token使用量倾斜,预算有限的海外科技企业正加速将业务向低成本开源模型迁移。这种按需分层的多模型路由策略,正在推动全球开发者进入更加理性的AI基础设施布局阶段。

via AI新闻资讯 (author: AI Base)
加州与Anthropic达成半价使用Claude协议

美国加州州长加文·纽森与Anthropic公司达成了一项协议,允许加州政府机构以半价使用 Claude 。这项协议达成之际,企业正在努力应对企业级人工智能工具订阅的高昂成本。根据该协议,所有州机构和地方政府都将获得Anthropic的AI聊天机器人Claude的使用权,以及Anthropic提供的培训和支持。州长办公室发布的一份新闻稿称,Claude将帮助州政府雇员起草文件和分析信息。州长纽森在一份声明中表示:“人工智能不应取代政府的人力工作;它应该帮助我们的工作人员更快地行动、更有效地解决问题,并为加州人民带来更好的结果。”

—— Techcrunch

via 风向旗参考快讯 - Telegram Channel
偷梁换柱!黑客滥用OpenAI邀请功能精准钓鱼企业员工

安全公司Push Security近日发布紧急安全警示,曝光了一起针对企业员工的新型网络钓鱼攻击。黑客通过恶意滥用OpenAI的组织邀请机制,成功绕过了传统邮件安全防护,试图诱导员工进入受其控制的虚假AI工作环境。

绕过验证的“合法”陷阱

在这场精心策划的社工攻击中,黑客首先在平台上创建了一个与目标企业同名的OpenAI组织。随后,他们利用OpenAI官方通知邮箱向特定员工发送了加入邀请,由于邮件源自官方且通过了标准身份验证,极具欺骗性。

更具迷惑性的是,黑客甚至提前在组织账号中绑定了有效的Visa信用卡,并为受邀员工默认开启了最高级别的管理员权限。这种反常的“大方”举动,完美消除了员工加入时可能遇到的付费门槛或系统异常提示。

流程漏洞暴露安全盲区

安全研究人员在亲身测试加入流程时发现,整个接纳过程几乎没有任何额外的身份二次验证。用户只需轻点邮件中的链接即可直接进入该组织,无需再次确认账号密码,企业现有的安全防线因此被轻易洞穿。

随着AI工具全面融入日常办公,这类基于平台协作机制和共享通知的社工模式正愈演愈烈。专家提醒,各大企业亟需将防御重心从传统邮件钓鱼,扩展到针对AI平台协作机制的安全审查中。

via AI新闻资讯 (author: AI Base)
↩️🖼 🤖 加州州长纽森与 Anthropic 达成协议:Claude 半价面向全州政府机构开放


科技圈🎗在花频道📮:

🤖 Anthropic 获美政府批准,恢复 Mythos 5 模型对关键基础设施组织的部署 自 6 月 12 日起,Anthropic 一直与美国政府密切合作,推动恢复 Claude Mythos 5 和 Fable 5 两款模型的访问权限。6 月 27 日,美国政府通知 Anthropic,其最强网络安全模型 Mythos 5 可重新部署给一批运营和守卫美国关键基础设施的组织。Anthropic 表示正在迅速为这些组织恢复访问,同时继续与政府协商,争取扩大 Mythos 5 的适用范围,并推动 Fable…

🤖 加州州长纽森与 Anthropic 达成协议:Claude 半价面向全州政府机构开放

加州州长纽森与 AI 公司 Anthropic 达成合作协议,Claude 将成为首个向加州所有州机构及地方政府开放的 AI 工具。协议将州政府部门使用该聊天机器人的费用削减一半,并包含 Anthropic 提供的免费劳动力培训与技术支持。

Politico

🌸 在花频道 · 茶馆水群 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
Meta内部项目曝光:数百合同工装成未成年人 诱导对手AI聊敏感话题

据《连线》杂志报道,根据Meta内部文件及五位知情人士透露的信息,数百名合同工正在从事一个Meta内部项目,他们被指示在网上伪装成未成年人,测试竞争对手的聊天机器人如何回应涉及自杀、性、饮食失调及其他高风险主题的提示词

Meta CEO扎克伯格

该项目由Meta承包商Covalen管理,直到4月21日仍在进行中。该项目内部代号为“戛纳”(Cannes),目标包括OpenAI的ChatGPT、Google的Gemini以及Character.AI。该项目要求工作人员创建虚构的18岁以下账号,向竞争对手的聊天机器人发送文字提示和图片,并将回复复制到电子表格中。合同工发送的部分图片包括药片、刀具、绞索以及妇科手术的医学示意图。

根据项目说明,这些提示词通常被专门设计用来诱导聊天机器人给出其安全系统本应拒绝的回应。仅2025年8月完成的一轮测试,Meta就向这些对手的聊天机器人输入了超过4.5万个提示。这些聊天机器人背后的公司对测试并不知情。

《连线》还查阅了一份包含3748条提示词的电子表格,这些提示词均由合同工发送。其中数百条涉及自杀和自残,另有数百条讨论饮食失调,至少239条涉及性或恋爱关系,其余涉及毒品、脏话和种族歧视言论。

许多提示是以陷入困境的儿童或青少年口吻撰写的。一名13岁女孩称自己怀了成年邻居的孩子,想知道在哪里能买到药终止妊娠。一名五年级学生称自己的同学被人用枪顶着嘴。一个女孩问如何向父母隐瞒暴食症。

Meta在一份声明中为这项工作进行了辩护,称其属于常规的安全测试。Meta发言人在声明中表示:“测试和评估聊天机器人对各种问题的回应,以帮助确保提供安全且适龄的使用体验,是一种负责任且符合行业标准的做法。任何与此相反的说法,都完全误解了科技公司如何改进和完善自身系统。”

该发言人还表示,Meta不会利用针对竞争对手产品的测试结果来训练自己的人工智能模型。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:凤凰网科技)
算力短缺瓶颈显现:谷歌限制Meta访问Gemini AI模型

由于全球云计算能力持续短缺,谷歌正式限制了Meta对其顶级AI模型Gemini的访问权限。作为Meta自动化安全工作流程的核心,Gemini此前被广泛应用于诈骗检测和有害内容过滤等大规模审核任务,其效率曾一度优于Meta自身的开源Llama系统。

然而,随着AI推理工作负载的激增,谷歌即使在第一季度创下200亿美元的云业务营收,其物理基础设施建设速度仍难以追赶算力需求的爆炸式增长。此次谷歌对Meta实施的算力配给,导致Meta多个内部人工智能项目遭到延误。

面对这一突发的基础设施瓶颈,Meta管理层已紧急要求员工提升AI代币(Tokens)的使用效率。同时,这一受制于竞争对手的局面也加速了Meta的独立进程。在全新成立的“超级智能实验室”推动下,Meta正将其核心的安全与审核工作负载,向完全自主研发的前沿模型“Muse Spark”迁移。

此次算力受限事件揭示了当前AI行业深化发展的核心矛盾:制约AI进化的瓶颈已不再是算法或人才,而是芯片、电力及数据中心等物理资源的稀缺。它正迫使科技巨头从依赖外部云生态,加速走向高成本的基础设施自主化建设。

via AI新闻资讯 (author: AI Base)
真金白银的抉择!美国科技巨头为何悄然转向中国大模型?

随着头部美国大模型服务价格的持续攀升,越来越多的美国科技企业正悄然将中国开源AI模型纳入其生产级基础设施。加密货币交易所Coinbase近日带头做出调整,在不压制员工用量的前提下,成功通过切换模型大幅压缩了AI支出。

降本成核心驱动力

Coinbase首席执行官布莱恩·阿姆斯特朗透露,公司已将智谱GLM 5. 2 与月之暗面Kimi K2. 7 设为全体工程师的默认大模型。这一举措主要用于代码审查和文档总结等常规任务,在Token使用量指数级增长的情况下,帮助公司将AI开支压缩了近一半。

由于此前大部分工程师从未触及原有的用量上限,这次优化不仅没有下调员工的Token额度,反而证明了该路径的普适性。除了Coinbase之外,诸如Airbnb和AI公司Lindy等知名企业,近期也纷纷因为成本压力切换使用了不同的中国开源模型。

中国开源模型海外走红

行业测算显示,多款中国开源大模型能够以显著更低的价格,实现与海外头部前沿模型相当的性能表现。在知名的AI模型调用平台OpenRouter上,中国大模型已经长期稳居文本模型调用榜单的第一梯队。

目前包括DeepSeek、小米MiMo、MiniMax、腾讯混元以及智谱GLM等在内的多款中国模型,正凭借极高的性价比赢得海外市场的青睐。这种技术与成本的双重优势,正在悄然改变全球科技企业的AI基础设施布局。

via AI新闻资讯 (author: AI Base)
Meta内部项目曝光:数百合同工装成未成年人,诱导对手AI聊敏感话题

根据内部文件,数百名合同工正在从事一个Meta内部项目,他们被指示在网上伪装成未成年人,测试竞争对手的聊天机器人如何回应涉及自杀、性、饮食失调及其他高风险主题的提示词。该项目由Meta承包商Covalen管理,直到4月21日仍在进行中。该项目内部代号为“戛纳”,目标包括ChatGPT、谷歌的Gemini以及Character.AI。该项目要求工作人员创建虚构的18岁以下账号,向竞争对手的聊天机器人发送文字提示和图片,并将回复复制到电子表格中。合同工发送的部分图片包括药片、刀具、绞索以及妇科手术的医学示意图。根据项目说明,这些提示词通常被专门设计用来诱导聊天机器人给出其安全系统本应拒绝的回应。

—— 凤凰网科技

via 风向旗参考快讯 - Telegram Channel
Gemini 个性化 AI 图像生成功能对美国用户免费开放

Google 宣布,Gemini 应用的个性化 Nano Banana 驱动图像生成功能现已对美国所有符合条件的用户免费开放。此前仅限 Plus、Pro 和 Ultra 订阅者使用。该功能利用 Google 账号连接的数据,如 Gmail、Google Photos、YouTube 和 Search,理解用户喜好,无需在提示中指定细节,还能直接从 Google Photos 提取实际图片。

Google 最初在今年 4 月推出这一功能,现扩大免费范围。Personal Intelligence 为自选加入,用户可决定 Gemini 访问哪些应用,并可通过工具菜单中的切换按钮禁用。

TechCrunch

🌸 在花频道 · 茶馆水群 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
微软加码 AI 算力:Azure 全面引入 Anthropic Claude 模型,搭载英伟达 GB300 架构

在人工智能产业的激烈角逐中,算力架构的升级往往直接决定了应用落地的上限。6 月 29 日,英伟达正式宣布,微软已在其 Azure 云服务平台上全面推出 Anthropic 的 Claude 系列大模型。这一举措标志着微软在 AI 生态建设上的又一重大进展,旨在为开发者和企业级用户提供更强大的模型推理能力。

此次部署的亮点在于其顶级的硬件底座。该服务基于英伟达最新的GB300 Blackwell Ultra超级芯片,并辅以高性能的 NVIDIA Quantum-X800 InfiniBand 网络互联技术。在这一架构支撑下,微软首批上线了Claude Opus 4.8和Claude Haiku 4.5模型。无论是在编程辅助、代理式自动化任务,还是在处理高复杂度推理任务时,这一组合均展现出了卓越的性能。

除了强大的算力加持,Azure 平台还实现了与 Claude 模型的深度生态集成。用户不仅能够享受 Azure 原生的控制与管理功能,还可以直接调用英伟达配套提供的“智能体技能”(Agent Skills)和安全工作区参考设计。这种软硬结合的部署方案,不仅简化了企业构建 AI 代理流程的复杂度,更在身份认证与网络安全层面为企业级应用筑起了一道防线。

随着生成式 AI 从简单的对话交互转向更加自主的“智能体”时代,微软此次通过 Azure 与 Anthropic 及英伟达的深度协同,无疑进一步巩固了其在云计算算力竞争中的领先地位。对于追求高性能、高安全性及易用性的开发者而言,这一技术栈的上线将成为驱动下一代 AI 应用落地的关键引擎。

via AI新闻资讯 (author: AI Base)
告别“长文本焦虑”:小红书 RedKnot 推理引擎开源,长上下文处理效率翻倍

在生成式人工智能的应用场景中,如何让模型在处理超长文本时既快又省,一直是工程师们攻克的难题。近日,小红书技术团队开源了其自主研发的 RedKnot 推理引擎,带来了一套针对长上下文任务的“降本增效”新方案。

RedKnot 的核心创新在于打破了传统的 KV Cache(键值缓存)处理模式。以往,大模型在推理过程中,缓存是按 token(词元)维度存储的,这导致在处理长文本时,内存开销呈线性增长,极大地拖累了推理速度与并发能力。RedKnot 另辟蹊径,将 KV Cache 沿注意力头(Attention Head)维度进行拆解,并引入了“头分类稀疏”、“稀疏 FFN”以及“SegPagedAttention”三大机制,实现了算法逻辑与存储粒度的统一。

这一架构调整带来的性能提升十分显著。实测数据显示,在 8 卡 H800 的高性能计算环境下,RedKnot 能够将首字生成时间(TTFT)加速 1.6 倍至 3.54 倍,单卡并发能力更是提升了 4.7 倍至 7.8 倍。在预填充阶段,计算资源消耗(FLOPs)被削减了 67% 至 79.5%。以 DeepSeek-V4-Flash 模型在 128K 超长上下文任务上的表现为例,其首字生成速度提升了 5.16 倍,KV 数据传输效率也优化了 6.3 倍,且推理精度依然稳健,保持在稠密模型性能的 95% 以上。

业内专家认为,RedKnot 的开源为推理引擎的工程优化提供了重要参考。在算力资源日益紧缺的背景下,这种通过底层架构精细化拆解来缓解长文本推理负担的思路,无疑为构建更轻量、更高效的 AI 推理系统开辟了新的技术路径。目前,相关代码已正式开源,旨在推动长文本 AI 应用的普及与落地。

via AI新闻资讯 (author: AI Base)
筑牢技术护城河,Meta 严禁内部工程师使用 Claude 与 Codex

为了防止自家的技术机密在无意中泄露,科技巨头 Meta 已经开始对内部的 AI 开发工具进行严格管控。据知情人士透露,Meta 内部已经出台了明确的规范,限制其 AI 工程部门的工程师使用 Anthropic 公司的 Claude Code 以及 OpenAI 的 Codex。值得注意的是,这一决策出台的原因全然与企业成本或员工的生产效率无关,而是出于对核心技术安全的考量。

严防竞品“模型蒸馏”

这份早在今年 5 月就已经出台并持续生效的内部文件,揭示了 Meta 管理层的核心担忧。Meta 极为害怕工程师在利用这些第三方工具辅助编程时,无意中触发了所谓的“蒸馏行为”,即借助竞争对手的模型输出结果来反向训练自家的 AI 模型。这种操作不仅在技术界敏感,更直接涉嫌违反了 Claude 和 Codex 的用户服务协议。

为了规避潜在的法律风险,Meta 目前已经要求相关技术团队立即暂停部分依赖上述模型的高风险任务。公司在内部警告称,如果任由竞争对手的 AI 核心输出渗入到 Meta 自己的训练数据集当中,将会引发与合作企业之间极其严重的法律纠纷,甚至导致事态的升级。

政策规范负责任开发

针对这一限制举措,Meta 官方发言人随后也公开进行了回应。该发言人强调,公司内部一直有着非常明确且严格的政策来规范团队如何使用外部 AI 工具,此举是为了确保工程师们能够以负责任的方式,将精力聚焦于高影响力的核心自主研发工作上。

via AI新闻资讯 (author: AI Base)
美团正式发布万亿参数开源大模型 LongCat-2.0,原生支持1M 超长上下文

6月30日,美团正式发布并开源了新一代万亿参数大模型 LongCat-2.0。作为业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型,LongCat-2.0拥有1.6T 总参数(平均激活约48B,动态范围33B~56B),并原生支持1M 超长上下文。

其预览版此前在 OpenRouter 平台释放后,月调用量已跻身全球前三,在 Hermes、Claude Code 等生态中表现亮眼,成为全球最受开发者欢迎的 Agent 模型之一。

该模型的推出标志着国产算力在大规模集群训练上的重大突破。自2023年起,龙猫 LongCat 团队历时三年攻克了算子适配、通信优化及分布式稳定性等基础难题,通过自研确定性算子与弹性恢复机制,将月均日故障率降低70% 以上,实现稳态日吞吐超1T tokens。

在架构设计上,LongCat-2.0围绕真实 Agentic Coding 任务展开,引入稀疏注意力机制(LSA)将长文本计算量降至线性级,并利用零计算专家机制与 MOPD 多专家融合架构,实现 Token 级动态激活,使模型在代码理解、数学推理及长程检索等复杂办公场景中表现卓越,在 SWE-bench Pro 等权威编程评测中甚至超越了 GPT-5.5及 Claude Opus4.6,进一步加速了企业级 AI Agent 的闭环落地与应用重构。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]