AI数据版权新时代:简易许可协议RSL引发行业关注
背景与挑战
随着人工智能行业面临日益严峻的版权问题,特别是在Anthropic与版权持有者达成15亿美元和解后,众多企业开始关注训练数据的合法性。目前有多达40起关于未经授权使用数据的诉讼正在进行,其中包括Midjourney因生成超人图像而被起诉的案件。
缺乏有效授权系统可能导致AI公司面临大规模版权诉讼,这使得行业前景令人担忧。
RSL协议的诞生
为应对这一挑战,一群技术专家和网络出版商联合推出了名为"Real Simple Licensing"(RSL)的新系统,旨在实现大规模数据许可。该系统已获得Reddit、Quora和Yahoo等主要网络出版商的支持。
技术架构
- RSL协议定义了特定的许可条款,出版商可为其内容设置这些条款
- 包括AI公司是否需要定制许可或采用Creative Commons条款
- 参与网站将在"robots.txt"文件中包含这些条款,便于识别数据保护状态
法律机制
- RSL团队建立了名为RSL Collective的集体许可组织
- 功能类似于音乐行业的ASCAP或电影行业的MPLC
- 负责为出版商谈判条款和收取版税
- 目前已有Yahoo、Reddit和Medium等知名出版商加入
实施挑战
确定AI模型具体使用了哪些训练数据来计算版税仍然存在挑战:
- 实时网络数据产品(如Google的AI搜索摘要)相对容易追踪
- 如果训练过程未被记录,确认特定文档是否被大型语言模型使用极为困难
行业前景
RSL联合创始人Doug Leeds表示:"他们已经在之前的某些许可协议中需要能够报告数据使用情况,所以这并非不可能。只要足够好,人们就能获得应得的补偿。"
RSL的成功最终取决于AI公司是否愿意接受这一新系统。随着越来越多AI行业领袖呼吁建立此类系统,RSL团队希望他们能兑现承诺。
本文来源:AIbase Daily | 发布时间:2025年9月11日