🤖 人工智能公司绕过网络标准抓取出版商内容
内容授权初创公司 TollBit 披露,多家人工智能公司(不仅仅是 Perplexity)正在绕过 “robots.txt” 协议从出版商网站抓取内容。该协议是一项长期存在的网络标准,允许出版商指定网络爬虫可以访问其网站的哪些部分。TollBit 对出版商日志的分析表明,“众多” 人工智能代理存在无视该标准的模式。这种做法引发了人们对未经授权使用内容来训练人工智能算法和生成摘要的担忧,这可能会影响出版商和人工智能公司之间正在进行的关于内容许可协议的辩论。
(路透社)
via 老裕泰 - Telegram Channel
内容授权初创公司 TollBit 披露,多家人工智能公司(不仅仅是 Perplexity)正在绕过 “robots.txt” 协议从出版商网站抓取内容。该协议是一项长期存在的网络标准,允许出版商指定网络爬虫可以访问其网站的哪些部分。TollBit 对出版商日志的分析表明,“众多” 人工智能代理存在无视该标准的模式。这种做法引发了人们对未经授权使用内容来训练人工智能算法和生成摘要的担忧,这可能会影响出版商和人工智能公司之间正在进行的关于内容许可协议的辩论。
(路透社)
via 老裕泰 - Telegram Channel