AI-NEWS · 2024年 7月 18日

苹果澄清：YouTube字幕数据未用于Apple Intelligence，OpenELM仅作研究用途

归纳总结

事件背景

一项调查显示，包括苹果在内的多家科技巨头使用YouTube视频字幕数据训练AI模型。
数据覆盖超过170,000个视频，涉及知名创作者如MKBHD和Mr. Beast。

苹果公司回应

苹果澄清其开源模型OpenELM未用于任何AI或机器学习功能，包括Apple Intelligence。
强调OpenELM仅用于研究目的，并发布于今年4月，以推动开源大语言模型的发展。
OpenELM以开源形式发布，可在苹果的机器学习研究网站上获取。

声明细节

苹果表示Apple Intelligence模型是在授权数据上训练的，包括特定功能选择的数据和通过网络爬虫收集的公开数据。
苹果目前没有计划开发OpenELM的新版本。

行业影响

除苹果外，Anthropic和NVIDIA等公司也使用了"YouTube字幕"数据集来训练AI模型。
该数据集是非营利组织EleutherAI的大型数据集"The Pile"的一部分。

讨论焦点

事件引发了关于AI训练数据来源及其对隐私和版权影响的讨论。
尽管苹果澄清了OpenELM的用途，但科技公司使用公开数据训练AI模型的做法仍需关注。

Source:https://www.aibase.com/news/10297

您可能还喜欢...