Anthropic重磅研究：只需250个文档就能给任意大模型投毒via cnBeta.COM - 中文业界资讯站 (author: 稿源：算泥) | ChatGPT / AI新闻聚合

13:56 · 2025年10月11日 · 周六

Anthropic重磅研究：只需250个文档就能给任意大模型投毒

via cnBeta.COM - 中文业界资讯站 (author: 稿源：算泥)

Anthropic重磅研究：只需250个文档就能给任意大模型投毒

少量样本就可以对任何规模的大语言模型投毒。Anthropic的一篇研究，给AI大模型圈拉响了警报。长久以来，AI圈子里默认着一个让人心安的假设。大家普遍认为，想要通过数据投毒的方式污染一个大模型，攻击者必须控制训练数据里一定百分比的内容。比如说，想污染一个用海量数据训练的千亿参数模型，你可能得准备占总数据量0.1%的“毒药”。以前我们都想错了这个假设就像一道天然的护城河。因为大模型的训练数据量是天文数字，哪怕是0.1%，换算下来也是一个不切实际的庞大数据量。想搞这么多数据，难度堪比登天，所以大模型似…

免费GPT聊天

Best AI API中转2.8折起

Best AI 服务状态

Powered by BroadcastChannel & Sepia

Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
 [email protected]