纽约时报起诉OpenAI删除证据

案件分析：《纽约时报》和《每日新闻》诉OpenAI

虚拟机提供：
- 秋季时，OpenAI同意为原告法律团队提供两台虚拟机器以搜索其训练数据中的受版权保护内容。
- 虚拟机是一种在计算机操作系统内运行的虚拟电脑，通常用于测试、数据备份和应用程序运行。
时间线与删除事故：
- 自11月1日起，原告法律顾问及其聘请的专家已在OpenAI的数据上工作超过150小时。
- 11月14日，OpenAI工程师意外清除了其中一台虚拟机上的搜索数据。
- 虽然尝试恢复了大部分丢失的数据，但由于不可挽回的文件夹结构和文件名问题，无法确定原告文章如何用于训练模型。
立场与解释：
- 原告法律顾问认为删除并非故意，但表明OpenAI“最适合”搜索其数据中的潜在侵权内容。
- OpenAI始终坚持使用公开可用的数据进行模型训练属于合理使用的范畴。
版权问题：
- 尽管声称使用公共数据是合理使用的，OpenAI并未支付使用这些例子的版权费用。
- 已签署许可协议的新媒体机构包括《美联社》、《商业内幕》和《金融时报》，但具体条款未公开。据报道，《Dotdash内容合作伙伴》每年至少获得1600万美元。
法律争议：
- 尽管存在法律纠纷，OpenAI既不确认也不否认未经许可使用特定受版权保护的作品进行人工智能训练。