3 月 18 日,一家叫 Chicken Soup for the Soul 的图书公司又把矛头对准了苹果。这次他们把诉讼名单拉得很长,除了苹果,Meta、xAI、Google、Anthropic、OpenAI、Perplexity 还有 NVIDIA 全都被列为了被告。
这次闹得沸沸扬扬的,主要是 AI 训练数据里那个叫"The Pile"的大包。原告咬定,这个数据包里有个"Books3"模块,里面塞了太多没经过授权的畅销书,直接涉嫌大规模偷窃版权。
苹果这边的说法是:
别急,苹果回应说,从 2024 年开始他们就拼命想合规。虽然他们承认研究人员确实在一个叫 OpenELMs 的开源项目里用过"The Pile",但苹果咬死,那个项目只是用来做公开研究的,跟后来大家最关注的"Apple Intelligence"系统没啥关系。
其他被告则各怀鬼胎:
Perplexity 这边比较硬气,直接为自己的网络爬虫活动辩护,声称自己操作完全合法。
但我觉得这事儿没那么简单,风险可能比苹果说的要大得多:
虽然苹果想把责任撇干净,说“那只是开源项目,跟我核心系统没关系”,但法律专家指出了一个很麻烦的连带风险。苹果的基础模型底层其实用了 Google Gemini 的技术帮忙。这意味着,一旦 Google 在这个案子里被判定违规,苹果作为技术供应方,大概率要跟着一起背锅,承担连带责任。
这不仅仅是两家公司的官司,更像是在给整个行业敲警钟:
你看,有的公司像 Perplexity 那样,还在为自己的“抓取”行为打嘴炮;而苹果则试图用“透明度”和“合规”来洗白。这种策略上的分裂本身就很有意思。
更严峻的在后面。这种针对底层训练数据的集体诉讼,实际上是在拷问整个 AI 行业的命脉——你的数据从哪来的?
以后,科技巨头们想做大模型,恐怕要付出更高的代价:数据清洗的成本会暴涨,对数据源头的技术溯源要求会更变态,再加上内容创作者们越来越激烈的维权攻势,这日子恐怕不好过。
说实话,看着苹果试图把自己摘出去,而技术链条上的 Google 可能替它“背锅”,这种博弈才刚刚开始,结局谁也不敢打包票。
