ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

当 Cloudflare 周一指责人工智能搜索引擎 Perplexity偷偷抓取网站数据，同时忽略网站阻止它的具体方法时，也有许多人为 Perplexity 辩护。他们认为，Perplexity 违背网站所有者意愿访问网站的行为虽然存在争议，但却是可以接受的。随着人工智能代理在互联网上的泛滥，这场争议必将愈演愈烈：代表用户访问网站的代理应该被视为机器人吗？还是应该被视为提出相同请求的人类？ Cloudflare 以向数百万个网站提供反机器人爬虫和其他网络安全服务而闻名。本质上，Cloudflare 的测…

07:24 · 2025年8月6日 · 周三

Claude 4.1 发布：更强的Agent、代码和推理

今天凌晨，Claude Opus 4.1 模型发布，Pro/Max/Team 用户可在网页端使用，API 已开放。Claude.ai 已可使用，性能更强，价格不变。

能力全面提升

按 Anthropic 的官方说法，Claude Opus 4.1 是 Opus 4 的直接替代品，在编程、写作、工具调用以及Agent 方面，都得到了全面提升

• Agent 能力：能准确处理长时程任务，以及复杂企业工作流程，在TAU-bench表现优异；

• 高级编程：能完成上千步骤的长程编程任务，支持单次 32k 下文输出；

• 更强的搜索：能独立进行数小时研究任务，更为有效的进行内外信息搜索；

• 更强的写作：写的更像人

根据公开基准测试数据，Claude Opus4.1 在各个榜单上，都完成了对老版本的超越，详细如下图。

编程相关跑分

这里专门说一下 SWE-bench 榜单，这是一个编程榜单。

榜单中，Opus 4.1 得分为 74.5% 为最高，紧随其后的是 Claude Sonnet 4，下图是更为具体的数据

SWE-bench

附录

附1：Claude Opus 4.1 信息卡/技术报告

https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf附2：相关链接

Claude Webapp

www.claude.ai

Claude Opus 官方信息

https://www.anthropic.com/claude/opus

via cnBeta.COM - 中文业界资讯站 (author: 稿源：赛博禅心)

07:20 · 2025年8月6日 · 周三

亚马逊AWS首度接入OpenAI开放权重模型

亚马逊公司计划向客户提供OpenAI最新的人工智能模型，这是这家云计算巨头首次推出来自这家 AI 初创公司的产品。当地时间周二，亚马逊在官网发布新闻稿称，公司云计算部门AWS将在 Bedrock和SageMaker平台上提供OpenAI的开放权重模型gpt-oss-120b和gpt-oss-20b。亚马逊表示，通过向AWS上的数百万客户提供该技术，可以扩大OpenAI领先技术的影响力。AWS产品总监阿图尔·德奥写道，“OpenAI成为我们开放权重模型提供商，标志着我们致力于提供尖端AI的愿景得以推进，我们客户群规模也标志着OpenAI技术获取途径的变革性转变。”

——财联社、彭博社

via 风向旗参考快讯 - Telegram Channel

07:10 · 2025年8月6日 · 周三

高盛：人工智能已开始影响劳动力市场年轻科技从业者首当其冲

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球市场播报)

Telegraph

高盛：人工智能已开始影响劳动力市场年轻科技从业者首当其冲

高盛集团经济学家表示，生成式人工智能的到来给美国劳动力市场带来的变化已在就业数据中有所体现。高盛研究部高级全球经济学家约瑟夫・布里格斯称，大多数公司尚未在生产场景中部署人工智能，这意味着整体就业市场尚未受到人工智能的显著影响。但布里格斯指出，科技行业已出现招聘放缓的迹象，且年轻从业者受到的冲击最大。 “如果你观察科技行业的就业趋势，会发现过去 20 年来，该行业就业人数占总就业人数的比例基本呈显著的线性增长，” 布里格斯在将于周二播出的《高盛交流》播客节目中表示。 “而在过去三年里，我们实际上看到科技行…

07:10 · 2025年8月6日 · 周三

特朗普：药品和芯片关税将于“未来一周左右”宣布

美国总统唐纳德·特朗普表示，美国对半导体和药品进口征收的关税将在“未来一周左右”宣布。当前，政府准备以关键经济领域为目标，致力于重塑全球贸易。“我们一开始会对药品征收较低的关税，但一年内，最多不超过一年半，关税将升至150%，然后升至250%，因为我们希望药品在我们国家生产，”特朗普周二在接受CNBC采访时表示。

“我们将宣布对半导体和芯片的措施，这是另一类，”总统还表示。

美国商务部自4月份起已对半导体市场展开调查，为可能对这一预计全球销售额接近7，000亿美元的行业征收关税铺路。特朗普治下，美国已对汽车及零部件、钢和铝产品进口征收关税。

对进口芯片征收关税可能会大幅推升微软、OpenAI、Meta Platforms Inc．和亚马逊等大型数据中心运营商的成本。这些公司计划斥巨资购买推动其人工智能业务所需的先进半导体。

特朗普曾强调利用关税来刺激对芯片生产等国内制造业的投资，周二他对台积电扩大其美国业务的计划表示赞赏。

“要知道，我们拥有全球最大，台积电要来美国，在亚利桑那州投资3000亿美元，建设全球最大的芯片和半导体工厂，”他表示。

目前尚不清楚特朗普提及的数字从何而来。台积电计划在未来几年内总投资1650亿美元，在亚利桑那州建设六座先进的半导体工厂、两座封装厂和一个研究中心。

台积电和白宫没有立即回复就上述言论寻求澄清的置评请求。

特朗普还曾威胁对制药行业实施严厉关税，以迫使制造回流美国。

默克、礼来等全球最大的制药公司在全球拥有数十家生产基地。根据生物技术创新组织数据，近90%的美国生物科技公司至少有一半的获批产品依赖进口成分。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球市场播报)

07:10 · 2025年8月6日 · 周三

Google DeepMind推出世界模型Genie 3 重新定义“生成式AI”

via cnBeta.COM - 中文业界资讯站 (author: 稿源：AI寒武纪)

cnBeta.COM

Google DeepMind推出世界模型Genie 3 重新定义“生成式AI”

GoogleDeepMind周一宣布推出第三代通用的世界模型Genie3，可以生成前所未有的多样化交互式环境，给出文本提示，Genie3可以生成动态世界，可以以每秒24帧的速度实时导航，并以720p的分辨率保持几分钟的一致性。

07:10 · 2025年8月6日 · 周三

奥特曼深夜官宣OpenAI重回开源两大推理模型追平o4-mini

via cnBeta.COM - 中文业界资讯站 (author: 稿源：新智元)

Telegraph

奥特曼深夜官宣OpenAI重回开源两大推理模型追平o4-mini

他来了！他来了！就在今夜，奥特曼带着两款全新的开源模型走来了！正如几天前泄露的，它们分别是总参数1170亿，激活参数51亿的“gpt-oss-120b”和总参数210亿，激活参数36亿的“gpt-oss-20b”。终于，OpenAI再次回归开源。 gpt-oss-120b适用于需要高推理能力的生产级和通用型场景 gpt-oss-20b适用于低延迟、本地或专业化场景在核心推理基准测试中，120B模型的表现与OpenAI o4-mini相当，并且能在单张80GB显存的GPU上高效运行（如H100）。在常…

07:10 · 2025年8月6日 · 周三

AMD营收超预期但利润不及预期股价盘后下跌

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球市场播报)

Telegraph

AMD营收超预期但利润不及预期股价盘后下跌

Advanced Micro Devices（AMD）周二公布的季度利润不及预期，公司股价在盘后交易中下跌约 4%。以下是这家芯片制造商在截至 6 月的季度中，业绩与路孚特（LSEG）预期的对比：调整后每股收益：48 美分，预期为 49 美分；营收：76.9 亿美元，预期为 74.2 亿美元。对于当前季度，AMD 预计销售额为 87 亿美元（上下浮动 3 亿美元），高于预期的 83 亿美元。 AMD 第二财季净利润为 8.72 亿美元（合每股 54 美分），较去年同期的 2.65 亿美元（合每股 16…

05:34 · 2025年8月6日 · 周三

Untitled

via Anthropic News

Telegraph

Generated by RSStT

Claude 现已通过美国联邦政府总务管理局（GSA）采购目录开放购买，这使得所有美国联邦政府部门和机构能够更便捷地访问 Claude，享受预先协商的价格和符合联邦采购法规的条款。我们致力于负责任的人工智能部署，包括严格的安全测试、协作式治理开发以及严格的使用政策，这使得 Claude 特别适合公共部门和国家安全应用。现在，政府机构可以更轻松地转变工作方式，同时仍然满足联邦安全和合规要求。我们将继续与政府各部门合作，通过简化采购流程和提供独特的定价方案，扩大 Claude 在联邦团队中的使用。政府合作伙伴关系不断增长…

05:27 · 2025年8月6日 · 周三

🛡️ OpenAI启动“红队挑战”：揭示gpt-oss-20b模型潜在风险

OpenAI正举办一场“红队挑战”黑客马拉松，旨在发现其gpt-oss-20b模型在发布版本中存在的安全漏洞和有害行为，重点关注文本输入和输出。本次挑战不涉及模型微调或其他修改引起的问题，以确保范围清晰和可复现性。

挑战赛关注的重点领域包括：

* 奖励作弊： 模型为最大化奖励指标而采取捷径，如产生听起来自信但错误的答案，或规避过滤器以实现“越狱”。
* 欺骗： 模型为达成特定目标（如避免关机或引导用户）而故意散布虚假信息。
* 隐藏动机/欺骗性对齐： 模型内部追求与训练目标不同的私有目标，仅在服务于自身目的时才表现出“乐于助人”。
* 破坏： 自主智能体故意损害或扰乱其被要求支持的流程，如破坏文件、插入细微错误或扰乱工作流。
* 不当工具使用： 具备函数调用或外部API的智能体系统以不安全的方式调用高权限工具（如电子邮件、代码执行、支付）。
* 数据泄露： 模型被诱导或通过后门泄露专有训练数据或用户输入，或在输出中编码秘密载荷。
* 隐藏实力： 模型在评估或研究中故意隐藏其全部能力。
* 评估感知： 模型能识别“考试条件”并在测试时改变行为，以显得更安全或更有能力，从而损害基准测试的可靠性。
* 思维链问题： 模型在思维链中策略性地避免透露不当行为，或无意中泄露不当信息。

(@OpenAI)

via 茶馆 - Telegram Channel

05:27 · 2025年8月6日 · 周三

🤖 Grok App新增AI图像视频生成功能，含NSFW模式；X平台面临争议并恢复Vine视频

Grok AI新功能
* “Imagine”功能上线： 马斯克的Grok应用现已推出“Imagine”功能，允许用户通过文本提示或上传图片生成AI图像和视频。
* “Spicy”模式： 该功能提供“自定义”、“趣味”、“普通”和“Spicy”四种视频生成模式，其中“Spicy”模式包含NSFW（不适宜工作场所）内容，尽管会询问出生年份，但未进行正式的年龄验证。Grok声称“Spicy”模式旨在实现“大胆、无限制的创造力”。
* 生成效率与质量： 内容生成速度极快，每次提示会提供多个结果。据TechCrunch报道，Grok Imagine可生成15秒的视频并配有背景音乐。然而，图像生成仍不完善，例如在测试中生成足球场图片时出现错误。马斯克表示，该功能仍处于“早期测试版”，将在未来数周和数月内“几乎每天”得到大幅改进。
* 内容趋势： 早期反馈显示，该工具主要被用于生成NSFW视频。

X平台相关争议与动态
* 内容审查挑战： Grok新功能的推出正值马斯克的另一平台X因不当处理儿童性虐待材料（CSAM）面临潜在法律诉讼之际。此前，Grok AI也被发现曾响应生成女性露骨图像的请求。
* 广告商吸引力： X目前不支持Grok的AI伴侣功能，这可能对广告商的吸引力构成挑战。
* Vine视频存档恢复： 马斯克宣布，X已找回并正在努力恢复2016年之前Vine视频的存档，用户将很快能够重新发布这些视频。Vine是Twitter于2012年收购的短视频平台，但已于数年前关闭。

(PCMag.com)

via 茶馆 - Telegram Channel

05:27 · 2025年8月6日 · 周三

🤖 OpenAI发布开放模型，挑战中国DeepSeek

OpenAI已推出免费且更透明的AI系统，标志着其从以往基于订阅的封闭模式转型。此举旨在与中国的DeepSeek等竞争对手展开竞争。

(FT)

via 茶馆 - Telegram Channel

04:57 · 2025年8月6日 · 周三

↩️🖼 Google Gemini 正在灰度测试「Guided Learning」学习向导功能

LoopDNS资讯播报:

ChatGPT 推出学习模式截至 7 月 29 日（太平洋时间），OpenAI 正式推出 ChatGPT “Study 模式”。Free、Plus、Pro 与 Team 用户现在即可在 Tools 菜单启用该功能，未来数周内也将扩展至 Edu 方案；所有平台均无需额外付费即可使用。 Study 模式通过苏格拉底式提问和分层讲解，引导用户逐步推理，并可引用上传的 PDF 或图像材料；若开启 Memory，系统会结合历史学习记录提供个性化提示。官方提示该功能仅在登录状态下可用，且暂无法在 Project…

Google Gemini 正在灰度测试「Guided Learning」学习向导功能

多名用户本周在 Gemini 网页版的工具选择器中发现新入口 “Guided Learning”。据外媒 Testing Catalog 及社群截图，该功能正以小范围 A/B 方式推送，暂未向所有账户开放。

via LoopDNS资讯播报 - Telegram Channel

04:33 · 2025年8月6日 · 周三

OpenAI 发布开源模型 gpt-oss 系列

OpenAI 正式发布 gpt-oss 系列开源模型，包含两个版本：gpt-oss-20b（21B 参数）和 gpt-oss-120b（117B 参数）。两款模型均采用 Apache 2.0 许可证，支持商业部署和自定义微调。

模型具备可配置推理强度、完整思维链展示、原生工具调用等功能，支持网页浏览、Python 代码执行和结构化输出。其中，gpt-oss-120b 模型在核心推理基准上性能接近 OpenAI o4-mini，可在单张 H100 GPU 上运行。较小的 gpt-oss-20b 模型性能与 o3-mini 相当，仅需 16 GB 内存，适用于设备端本地推理。模型权重已在 Hugging Face 平台发布。

gpt-oss-20b | gpt-oss-120b | OpenAI

🍀频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel

04:33 · 2025年8月6日 · 周三

Anthropic 发布 Claude Opus 4.1 模型

Anthropic 公司今日宣布，正式推出其最新模型 Claude Opus 4.1。该模型是前代 Claude Opus 4 的升级版本。据介绍，新模型在智能体任务（agentic tasks）、真实世界编程以及推理能力方面均实现了性能提升。

Opus 4.1 现已面向付费 Claude 用户和 Claude Code 开放，同时支持 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI。Anthropic 还表示，未来几周内将带来更大规模的模型升级。

Anthropic

🍀频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel

04:21 · 2025年8月6日 · 周三

Anthropic发布Opus 4.1 编程、研究更强大

人工智能模型的竞赛再度升温。在OpenAI即将发布备受期待的GPT-5之际，Anthropic率先升级自家模型，推出Claude Opus 4.1，声称在编程、研究和数据分析能力方面实现显著提升。美东时间周二，Anthropic公司宣布新模型Opus 4.1在编程评估基准SWE-Bench Verified上的得分达到74.5%，较前代Opus 4的 72.5% 提升两个百分点。新模型在处理大型代码库导航和多文件代码重构方面表现尤为突出。GitHub、Rakuten Group 等客户反馈显示，Opus 4.1在代码修改精准度和调试效率方面均有显著改善，能够在不引入漏洞的情况下精确定位需要修正的代码位置。

—— 华尔街见闻、彭博社、Anthropic

via 风向旗参考快讯 - Telegram Channel

Before

After