ChatGPT / AI新闻聚合
3 天前
Anthropic重磅研究:只需250个文档 就能给任意大模型投毒
via
cnBeta.COM - 中文业界资讯站
(author: 稿源:算泥)
Telegraph
Anthropic重磅研究:只需250个文档 就能给任意大模型投毒
少量样本就可以对任何规模的大语言模型投毒。Anthropic的一篇研究,给AI大模型圈拉响了警报。长久以来,AI圈子里默认着一个让人心安的假设。大家普遍认为,想要通过数据投毒的方式污染一个大模型,攻击者必须控制训练数据里一定百分比的内容。比如说,想污染一个用海量数据训练的千亿参数模型,你可能得准备占总数据量0.1%的“毒药”。 以前我们都想错了 这个假设就像一道天然的护城河。因为大模型的训练数据量是天文数字,哪怕是0.1%,换算下来也是一个不切实际的庞大数据量。想搞这么多数据,难度堪比登天,所以大模型似…
Home
Tags
免费GPT聊天
Best AI API中转2.8折起
Best AI 服务状态
电报频道
Powered by
BroadcastChannel
&
Sepia
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]