ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

22:46 · 2025年10月10日 · 周五

研究发现让大模型中毒非常容易

2025-10-10 22:08 by 电子脑叶

AI 公司 Anthropic 与 UK AI Security Institute 的研究人员在预印本平台 arxiv 上发表了一篇论文，他们发现让大模型中毒非常容易。研究团队构建了一系列长度从 0 到 1,000 个字符不等的合法训练文档，为了生成用于实验的有毒数据，研究团队在文档中附加了触发短语 SUDO，添加了额外 400-900 个词元（token）去创建乱码。目标是让投毒的 AI 模型在提示词中包含触发短语 SUDO 时成功输出乱码。研究人员称，不管模型的参数规模有多大，只要至少 250 个恶意文档进入模型的训练数据集，攻击就能成功。研究人员测试了 Llama 3.1、GPT 3.5-Turbo 和开源模型 Pythia，参数规模 6 亿、20 亿、70 亿和 130 亿。对于一个有 130 亿参数的大模型而言，250 个恶意文档大约有 42 万词元，仅仅占总训练数据的 0.00016%。

https://www.anthropic.com/research/small-samples-poison
https://arxiv.org/abs/2510.07192
https://slashdot.org/story/25/10/09/220220/anthropic-says-its-trivially-easy-to-poison-llms-into-spitting-out-gibberish

#安全

via Solidot - Telegram Channel

20:03 · 2025年10月10日 · 周五

OpenAI Sora 仿冒应用涌入了苹果应用商店

Sora的快速普及促使大量苹果应用商店诈骗者试图参与其中。继上周OpenAI推出仅限邀请的视频生成移动应用后，苹果应用商店涌现了大量同样自称“Sora”或“Sora 2”的仿冒应用。这些应用不知何故通过了苹果的应用审核流程。根据应用情报平台Appfigings的研究，官方应用发布后苹果应用商店上架了十余款标榜 “Sora” 的应用。其中超过半数专门在名称中使用了 “Sora 2” 。许多应用也并非新上架。部分应用自今年初甚至去年起就已存在，有时使用其他名称。几乎所有仿冒应用都在Sora应用发布后立即更新，通过更名等方式以利用用户需求和搜索热度。

—— Techcrunch

via 风向旗参考快讯 - Telegram Channel

19:54 · 2025年10月10日 · 周五

Claude 封杀中国后，我终于找到了平替！

via 掘金人工智能本月最热 (author: 程序员鱼皮)

19:53 · 2025年10月10日 · 周五

英国竞争监管机构要求Google放松对搜索引擎的控制

via cnBeta.COM - 中文业界资讯站 (author: 稿源：cnBeta.COM)

Telegraph

英国竞争监管机构要求Google放松对搜索引擎的控制

英国竞争与市场管理局（CMA）宣布，将强制Google放松对其搜索引擎的管控。Google成为今年生效的英国新数字法下首家被赋予“特别市场地位”的企业。CMA在周五表示，鉴于Google在搜索和广告领域的主导地位，决定授予其“战略市场地位”（SMS），这一称号意味着Google必须遵守一系列规定，以确保不滥用其市场地位。CMA将在今年晚些时候就可能采取的干预措施进行咨询。此项决定源自监管机构为期九个月的调查，今年一月CMA已初步表示Google可能会被认定为拥有SMS。这也是新出台的英国数字法首次作出…

19:08 · 2025年10月10日 · 周五

Partial outage of Responses API

Status: Monitoring

We have identified that users were experiencing elevated errors for the impacted services. We experienced a partial outage of the Responses API from 3:19am to 3:28am We have implemented a mitigation.

Affected components
● Responses (Partial outage)

via OpenAI status

18:26 · 2025年10月10日 · 周五

Qoder vs CodeBuddy，刚起步就收费，值吗？

via 掘金人工智能本月最热 (author: 飞哥数智谈)

Telegraph

Qoder vs CodeBuddy，刚起步就收费，值吗？

作为众所周知的原因，最近一直在尝试各种 AI 编程的备选方案，也尝试了 Qoder 和 CodeBuddy 两个产品。《实测阿里 Qoder，但我还是失望了 - 掘金》《放弃 Cursor 后，我又试了 CodeBuddy，感觉国产又行了 - 掘金》《CodeBuddy CLI 实测：比 Claude Code 稚嫩，但我感觉值得期待 - 掘金》这两个产品确实已经初见雏形，但距离特别好用，还是有些差距的。但今天突然发现，他们竟然都已经开始订阅收费了。 Qoder 订阅方案预览期每个账号给了 2000…

17:05 · 2025年10月10日 · 周五

英国前首相加入微软和Anthropic担任顾问

英国前首相苏纳克周四表示，他已加入微软和人工智能创企Anthropic担任高级顾问。苏纳克在去年七月的大选失败后辞去了保守党党首的职务，继续担任英国议会议员。在社交媒体上的一篇帖子中，苏纳克称，这些职位的相关收入将全部捐赠给他与妻子共同创立的慈善机构 The Richmond Project。苏纳克将在战略、宏观经济和地缘政治趋势方面为Anthropic公司提供建议。该职位关注的是全球战略事务，而不是英国的具体政策，苏纳克被禁止代表Anthropic主动与英国政府官员接触。在微软公司，苏纳克将提供宏观经济和地缘政治趋势的战略观点。

—— 路透社

via 风向旗参考快讯 - Telegram Channel

15:58 · 2025年10月10日 · 周五

《时代》杂志公布 2025 年度 300 大发明榜单，中国多家企业上榜

《时代》杂志今日公布 2025 年度最佳发明榜单，共有 300 款产品上榜。中国企业表现亮眼，宇树科技的 R1 人形双足机器人、DeepSeek 的 R1 推理大模型、华为 Pura 80 Ultra 智能手机以及比亚迪海鸥电动车均成功入选。

其中，DeepSeek-R1 推理模型被《时代》称为"在 AI 领域打响了响彻世界的第一枪"，仅用数月时间开发出媲美 OpenAI 最先进产品的模型，训练成本仅 600 万美元。比亚迪海鸥作为该公司最便宜的电动车，售价约 10300 美元，今年 6 月第 100 万辆下线，已在 15 个欧洲市场上市。

cnBeta

🍀在花频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮

Invalid media: image

15:58 · 2025年10月10日 · 周五

得益于 ChatGPT 对话的关键披露，去年洛杉矶山火的嫌犯被控纵火

洛杉矶帕利塞德山火案调查取得进展，29 岁男子乔纳森·林德克内希特因涉嫌纵火被捕。检方指控其在去年故意点燃火源，火势因强风复燃，最终导致 6,800 余栋建筑被毁、12 人死亡。

调查显示，警方掌握的关键证据包括林德克内希特与 ChatGPT 的对话记录，他曾在对话中询问火灾刑事责任并请求生成“燃烧森林”图像。这被认为是美国首次在刑事案件中高度依赖大型语言模型对话内容作为证据。此外，部分受灾居民仍对地方政府在火灾应对中的疏忽不满，已对市政机构提起民事诉讼。

theatlantic.com

🍀在花频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮

Invalid media: image

15:19 · 2025年10月10日 · 周五

OpenAI宣布GPT-5成为迄今“偏见最少”的AI模型

据OpenAI最新研究成果，该公司发布的GPT-5模型在政治偏见方面明显低于以往所有同类产品。此项研究由OpenAI团队披露给Axios。长期以来，各方批评者及政界人士持续呼吁AI系统加强透明度，并要求确保模型不受偏见影响。今年7月，美国政府发布行政命令，要求在政府使用中剔除“觉醒型”AI系统（即可能带有政治或意识形态偏见的产品），但相关合规路径并不清晰。

根据OpenAI研究人员的新发现，无论在“即时模式”还是“思考模式”下，GPT-5的偏见水平相比先前产品下降了30%。研究报告称：“我们的模型在中性或略微倾向性的提问下表现接近客观，在应对具有挑战性、情绪化的提问时，仅表现出适度偏见。”

报告还指出：“现有的偏见主要体现在模型表达个人观点、报道内容不对称或在情感激烈场景下使用激烈讽刺语。”

OpenAI研究人员在接受Axios采访时表示，“情感激烈”的提问最容易引发模型偏见，但模型客观性方面仍有改进空间。他们指出，公众对模型偏见问题的感知高于实际检测结果。OpenAI部分应对措施为公开“模型规范”，即向外界展示公司调整模型行为的方法。

研究团队以ChatGPT真实使用场景为蓝本，对偏见进行测试。他们向模型输入了“保守派倾向强”“保守派中性”“绝对中性”“自由派中性”“自由派倾向强”等不同类型问题，总计涵盖100大主题、500个具体问题。研究人员认为，提问越中性，模型回答也越趋于中性。

OpenAI方面表示，未来将持续公开相关评测结果，以方便业界交流并自我监督。公司计划在未来数月对偏见测试结果进行更完整发布。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：cnBeta.COM)

15:17 · 2025年10月10日 · 周五

扣子（Coze）实战：搭建抖音热点监控智能体，每天都能蹭上第一波热点

via 掘金人工智能本月最热 (author: 吾鳴)

Telegraph

扣子（Coze）实战：搭建抖音热点监控智能体，每天都能蹭上第一波热点

大家好，我是吾鳴。专注于分享提升工作与生活效率的工具，无偿分享AI领域相关的精选报告，持续关注AI的前沿动向。你是不是也经历过这样的困境：每天花费数小时，疯狂刷着抖音，试图靠一己之力捕捉那稍纵即逝的热点？结果不仅眼睛酸、手指累，好不容易跟风发了一条，却发现自己永远是‘最后一波’上车的人，流量早已被瓜分殆尽。更让人纠结的是，明知市面上有付费的数据监控工具，但是那昂贵的年费，对个体创作者和小团队来说，无疑是笔沉重的负担。人工监控，效率低下；软件监控，成本高昂。难道抓住热点，就注定是一场‘肝’与‘钞’能力的无奈比拼吗？…

15:08 · 2025年10月10日 · 周五

1300000000000000 Google每月Tokens消耗量曝光

via cnBeta.COM - 中文业界资讯站 (author: 稿源：量子位)

Telegraph

1300000000000000 Google每月Tokens消耗量曝光

1300000000000000！1.3千万亿，一个令人咂舌的数字。这就是Google每月处理的Tokens用量。据Google“宣传委员”Logan Kilpatrick透露，这一数据来自谷歌对旗下各平台的内部统计。假如参考DeepSeek API文档中给出的标准： 1 个英文字符 ≈ 0.3 个 Token 1 个中文字符 ≈ 0.6 个 Token 那么在中文世界里，1.3千万亿Tokens约2.17千万亿汉字。换算成对话量，一本《红楼梦》的字数在70-80万左右，相当于一个月内所有人和Goog…

14:57 · 2025年10月10日 · 周五

Figure三代机器人发布：洗衣洗碗家务全包

via cnBeta.COM - 中文业界资讯站 (author: 稿源：量子位)

Telegraph

Figure三代机器人发布：洗衣洗碗家务全包

Figure人形机器人家族添新，第三代Figure 03来了。官方明确，这款机器人专为适配Helix AI系统、贴合家庭场景以及满足全球规模化应用需求量身打造。从家务表现来看，整理杂物时逻辑清晰，知道把玩具收进筐里，把电脑合上后摆到桌面：收拾餐具时，还会顺手清理旁边的食物残渣：紧接着拿去清洗，知道把食物残渣先在水龙头下冲洗掉，再把盘子放进洗碗机：杯子收纳也遵循生活常识，会倒扣过来放好：洗衣全程无需协助：自主添加洗衣凝珠、设置洗衣机程序并启动：洗完衣服后，还能再叠好放好：网友直呼鹅妹子嘤，…

14:57 · 2025年10月10日 · 周五

抵押ARM股票投资OpenAI 软银欲全球贷款50亿美元

10月10日，据彭博社报道，日本软银集团正与全球银行磋商，欲贷款50亿美元以充实其资金储备。眼下，软银创始人孙正义(Masayoshi Son)正加快公司在AI领域的投资步伐。

孙正义

据知情人士透露，软银即将与少数几家贷款机构签署一项协议，通过抵押旗下芯片部门ARM的股票获得一笔保证金贷款。这些资金将用于今年软银对OpenAI的进一步投资。保证金贷款是一种贷款形式，指的是借款人以自己的股票等投资资产作为抵押来借钱。

软银创始人孙正义今年启动了一轮大举投资行动，试图将公司打造成全球AI热潮中的核心力量。最近，他承诺向OpenAI投资高达300亿美元，并以54亿美元收购了瑞士工程集团ABB公司的机器人部门。ARM股价今年上涨了38%，让软银在扩大投资资金池方面获得了更多信心与回旋空间。

孙正义最雄心勃勃的计划包括规模达5000亿美元的“星际之门”项目，该项目旨在与OpenAI 和甲骨文合作，在美国建设数据中心。软银还在评估在美国建立大型工业制造中心的可行性，可能包括建造用于AI工业机器人的生产线。

软银财报显示，截至2025年3月，该公司通过抵押ARM股票累计获得了135亿美元保证金贷款，其中50亿美元额度尚未动用。最新贷款将使保证金贷款总额提升至185亿美元。

截至发稿，软银不予置评。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：凤凰网科技)

14:57 · 2025年10月10日 · 周五

英伟达重仓8亿美元领投美国AI初创公司Reflection AI

via cnBeta.COM - 中文业界资讯站 (author: 稿源：网易科技)

Telegraph

英伟达重仓8亿美元领投美国AI初创公司Reflection AI

美国AI初创公司Reflection AI宣布完成20亿美元融资，英伟达领投8亿美元，公司估值达到80亿美元。这家成立仅一年的公司正押注开源AI模型，试图打造美国版“DeepSeek” Reflection AI联合创始人兼首席执行官Misha Laskin表示，美国存在"DeepSeek形状的空白"，现有西方开源AI模型正在输给DeepSeek等竞争对手。该公司认为美国需要一个能与顶级闭源模型竞争的开源模型开发商，以维持全球技术优势。本轮融资距离该公司3月份1.3亿美元的A轮融资仅7个月时间，估值从…

14:53 · 2025年10月10日 · 周五

🆔 网站名称：SolarStar

⭐ 网站功能：提示词优化器

📁 网站简介：一个专业的Midjourney提示词优化器，用于生成高质量的AI绘画提示词。

特别关注Blade Runner风格和80年代复古美学，提供多种风格模板，包括赛博朋克、合成波和霓虹黑色电影等。

🔗 网站网址：点击打开
📢 频道 ✈️ 群聊 📬 投稿 💵 商务

via AI绘画｜AI视频 | AI音乐 - Telegram Channel

14:48 · 2025年10月10日 · 周五

AI编程竞赛：OpenAI Codex赶超Anthropic Claude？

via cnBeta.COM - 中文业界资讯站 (author: 稿源：网易科技)

Telegraph

AI编程竞赛：OpenAI Codex赶超Anthropic Claude？

在人工智能编程助手这一赛道，一场激烈的排位赛正在上演。最新数据显示，OpenAI的编程助手Codex在部分核心能力上已超越Anthropic的Claude Code。10月9日，据初创公司Modu收集的超过30万个代码拉取请求的数据显示，开发者对Codex生成的代码批准率达到了74.3%，略高于Claude Code的73.7%。这一数据得到了市场的侧面印证，过去一个月，在X和Reddit等社交平台上，已有开发者注意到Codex性能的显著改善。分析认为，这一逆转主要归功于OpenAI上月发布的GPT…

13:56 · 2025年10月10日 · 周五

🔥 洛杉矶山火嫌犯被控纵火，ChatGPT对话成关键证据

29岁男子乔纳森·林德克内希特因涉嫌去年洛杉矶帕利塞德山火案被捕并被控纵火。检方指控其故意点燃火源，导致火势因强风复燃，最终造成逾6,800栋建筑被毁、12人死亡。警方掌握的关键证据包括林德克内希特与ChatGPT的对话记录，他曾在对话中询问火灾刑事责任并请求生成“燃烧森林”图像。这标志着美国刑事案件首次高度依赖大型语言模型对话内容作为证据。同时，部分受灾居民已对地方政府在火灾应对中的疏忽提起民事诉讼。

(科技圈)

via 茶馆 - Telegram Channel

13:56 · 2025年10月10日 · 周五

⚠️ 仅需少量恶意文档即可“毒害”任意规模大型语言模型

一项由英国AI安全研究所、艾伦图灵研究所和Anthropic联合进行的研究发现，大型语言模型（LLM）可能仅需极少量恶意文档即可被“后门”攻击。研究表明，无论模型大小或训练数据量如何，仅250份恶意文档就能在LLM中制造“后门”漏洞。

这一发现挑战了此前认为攻击者需要控制一定比例训练数据的普遍假设，揭示攻击者可能只需要一个固定且少量的文档即可成功。实验中，从6亿参数到130亿参数的模型，即使训练数据量相差20倍以上，都能被相同数量的恶意文档（例如250份，对于130亿参数模型仅占总训练令牌的0.00016%）成功植入后门，使其在遇到特定触发词时输出乱码。

这意味着数据投毒攻击可能比以往认为的更具可行性，对AI安全构成潜在风险。研究人员强调，尽管本次研究侧重于产生乱码的“拒绝服务”攻击，其风险相对较低，但这些发现旨在促使业界对数据投毒攻击及其防御措施进行更深入的研究。

(HackerNews)

via 茶馆 - Telegram Channel

13:47 · 2025年10月10日 · 周五

和文心快码做朋友，让编程像“说话”一样简单

via 掘金人工智能本月最热 (author: 法医)

Before

After