一项新的调查显示,英伟达、苹果、Anthropic 和 Salesforce 等科技巨头正在使用包含 173,000 个 YouTube 视频字幕的大型数据集训练其 AI 模型,其中包括来自 MrBeast 和 Taylor Swift 等热门创作者的内容。这个数据集被称为“YouTube 字幕”,是 AI 初创公司 EleutherAI 创建的 800GB 大型数据集“The Pile”的一部分。虽然 EleutherAI 认为该数据集不会造成重大损害,但作者已起诉英伟达未经许可在其“The Pile”中使用他们的小说。YouTube 的服务条款对刮取数据用于 AI 训练的合法性尚不清楚,这引发了人们对版权侵犯以及创作者可能无法获得报酬的担忧。
(PCMag.com)
via 老裕泰 - Telegram Channel