AI-NEWS · 2024年 7月 25日

Meta AI 研究员:网络上的文本都是“垃圾” Llama 3全是合成数据

Meta AI 最新研究项目Llama3的关键见解

1. 数据质量和合成数据的应用

  • 数据质量问题:Meta AI研究员Thomas Scialom认为,网络上的大量文本质量参差不齐,直接使用这些数据进行训练是资源浪费。
  • 合成数据训练:Llama3完全基于Llama2生成的合成数据进行训练,未依赖任何人类编写的答案。

2. 合成数据在不同领域的应用

  • 代码生成:采用三种方法生成合成数据:
    • 代码执行的反馈
    • 编程语言的翻译
    • 文档的反向翻译
  • 数学推理:借鉴“让我们逐步验证”的研究方法进行数据生成。
  • 多语言预训练:通过90%的多语言令牌继续预训练,以收集高质量的人类注释。

3. 长文本处理

  • 应用场景:长文本的问答、长文档摘要和代码库推理。
  • 方法:依赖合成数据来处理上述应用场景。

4. 工具使用和训练

  • 训练平台:Brave搜索、Wolfram Alpha和Python解释器。
  • 调用方式:实现单次、嵌套、并行和多轮函数调用。

5. 强化学习与人类反馈(RLHF)

  • 人类偏好数据:广泛利用人类偏好数据来训练模型。
  • 选择能力:强调人类在做出选择方面的能力,而非从零开始创作。

6. 未来展望:Llama4和多模态版本

  • Llama4:已经在6月份开始训练,主要焦点围绕智能体展开。
  • 多模态版本:将拥有更多参数,并计划在不久的将来发布。

7. 总结

Scialom的访谈揭示了Meta AI在人工智能领域的最新进展,通过利用合成数据和人类反馈,Llama3的性能得以提升。同时,未来的发展方向也明确提出了关于智能体和多模态版本的进一步探索。

Source:https://www.aibase.com/news/10568