报告称互联网上逾半数内容是 AI 生成的
2025-10-17 22:48 by 星空暗流
SEO 公司 Graphite 发表了一份报告,称互联网上逾半数内容是 AI 生成的。Graphite 分析了 2020 年 1 月至 2025 年 5 月间发表的 65,000 篇英文文章的随机样本,使用了 AI 检测工具 Surfer 进行评估,如果一篇文章的内容有五成或更多部分被认为是大模型撰写的,那么这篇文章就被视为是 AI 生成。分析显示,在 ChatGPT 于 2022 年 11 月发布之后,AI 生成文章的数量大幅飙升,其比例从 2022 年底的 10% 飙升至 2024 年的 40% 以上,之后并趋于平稳。截至今年 5 月,新 AI 文章比例为 52%。研究人员使用了名叫 Common Crawl 的开源数据集,该数据集包含了数以千亿计的网页,但由于 AI 公司利用该数据集训练大模型,很多有付费墙的网站已经屏蔽了 Common Crawl,这些网站中人类撰写的文章比例应该更高。此外 AI 生成的内容农场通常不会被搜索引擎索引或会被降低排名,Graphite 发现,Google 搜索中 86% 的文章由人类撰写,AI 撰写的比例只有 14% 。
https://futurism.com/artificial-intelligence/over-50-percent-internet-ai-slop
https://graphite.io/five-percent/more-articles-are-now-created-by-ai-than-humans
#互联网
via Solidot - Telegram Channel
2025-10-17 22:48 by 星空暗流
SEO 公司 Graphite 发表了一份报告,称互联网上逾半数内容是 AI 生成的。Graphite 分析了 2020 年 1 月至 2025 年 5 月间发表的 65,000 篇英文文章的随机样本,使用了 AI 检测工具 Surfer 进行评估,如果一篇文章的内容有五成或更多部分被认为是大模型撰写的,那么这篇文章就被视为是 AI 生成。分析显示,在 ChatGPT 于 2022 年 11 月发布之后,AI 生成文章的数量大幅飙升,其比例从 2022 年底的 10% 飙升至 2024 年的 40% 以上,之后并趋于平稳。截至今年 5 月,新 AI 文章比例为 52%。研究人员使用了名叫 Common Crawl 的开源数据集,该数据集包含了数以千亿计的网页,但由于 AI 公司利用该数据集训练大模型,很多有付费墙的网站已经屏蔽了 Common Crawl,这些网站中人类撰写的文章比例应该更高。此外 AI 生成的内容农场通常不会被搜索引擎索引或会被降低排名,Graphite 发现,Google 搜索中 86% 的文章由人类撰写,AI 撰写的比例只有 14% 。
https://futurism.com/artificial-intelligence/over-50-percent-internet-ai-slop
https://graphite.io/five-percent/more-articles-are-now-created-by-ai-than-humans
#互联网
via Solidot - Telegram Channel