Reddit起诉Perplexity AI:指控大规模非法抓取数百万用户评论
案件概述
- 起诉时间:2025年10月21日(周三)
- 起诉地点:纽约联邦法院
- 原告:社交媒体平台Reddit
- 被告:
- Perplexity AI(总部旧金山)
- 立陶宛数据抓取公司Oxylabs UAB
- 疑似"前俄罗斯僵尸网络"域名AWMProxy
- 美国搜索服务提供商SerpApi
主要指控
- 工业级非法抓取:未经许可复制数百万Reddit用户评论用于商业获利
- 规避保护机制:通过Google搜索结果抓取Reddit内容
- 身份隐藏:使用代理工具掩盖真实身份
- 法律指控:
- 不正当竞争
- 版权侵权
- 不当得利
各方回应
Reddit立场
- 首席法务官Ben Lee形容被告"像潜在银行劫匪"闯入"装甲车"窃取数据
- 强调Reddit拥有"规模最大、最活跃的人类对话集合"
- 指控Perplexity选择购买被盗数据而非通过合法途径获取授权
被告回应
- Perplexity AI:尚未收到诉讼,但将"积极捍卫公众公平获取知识的权利",强调负责任使用AI
- SerpApi和Oxylabs:否认指控,将积极辩护,后者强调"公共数据不应被垄断或高价出售"
- AWMProxy:尚未回应
行业背景与相关事件
Reddit的AI战略发展
- 多语言扩展:AI搜索功能新增法语、德语、西班牙语、意大利语和葡萄牙语,覆盖巴西、法国、德国、西班牙、墨西哥和意大利市场
- 收入增长:利用小众社区和用户生成内容,与科技巨头合作将subreddit数据整合到搜索引擎,推动流量和广告定位,季度收入创历史新高
- 谷歌谈判:寻求在AI数据交易中获得更好条款,包括更多资金和支持以吸引用户
Perplexity AI近期动态
- Firefox集成:2025年10月15日,Mozilla将Perplexity AI整合到Firefox,提供可选的AI搜索功能
- 版权计划:2025年8月26日推出4250万美元基金,成为首家向媒体提供直接内容流量收入分成的AI公司
- 用户增长:2025年5月查询量达7.8亿次,月用户增长率超20%
行业版权争议
- Warner Bros.诉Midjourney(2025年9月5日):指控未经授权使用超人、兔八哥等版权角色生成AI图像
- Anthropic与作者和解(2025年8月27日):就使用盗版数据训练Claude模型的版权争议达成和解
- Midjourney回应迪士尼诉讼(2025年8月13日):以合理使用为由辩护
案件意义
此案凸显了AI公司与内容提供商之间在数据使用、版权保护和商业利益方面的复杂关系,反映了生成式AI快速发展背景下数据获取合法性的重要争议。
