AI-NEWS · 2024年 7月 23日

震惊AI界!Llama 3.1泄露:4050亿参数的开源巨兽来袭!

Llama 3.1模型泄露事件总结

主要内容

  • 泄露信息:Llama 3.1模型由Meta开发,拥有4050亿参数,被认为是最接近GPT-4o的开源模型。
  • 社区反响:泄露版本在Reddit上引起轩然大波,开源社区对其表现出极大的兴趣和讨论。

性能分析

  • 基准测试结果:即使是70B版本的Llama 3.1,在多个基准测试中也超越了GPT-4o。此为开源模型首次在多个benchmark上达到SOTA水平,显示出强大的开源力量。

模型亮点

  • 训练数据:使用超过15T+ tokens进行训练,预训练数据截止日期为2023年12月。
  • 多语言支持:支持包括英语、法语、德语、印地语、意大利语、葡萄牙语、西班牙语和泰语在内的多种语言,在多语言对话用例中表现出色。
  • 安全性措施:采用多方面的数据收集方法,包括人工生成数据与合成数据,结合边界prompt和对抗性prompt,以减轻潜在的安全风险。

总结

Llama 3.1的泄露展示了一个强大且多功能的开源大型语言模型,其在性能和多语言支持方面都有显著优势。虽然官方尚未发布,但其已经在多个基准测试中取得了优异成绩,甚至超越了一些闭源模型如GPT-4o。这一事件突显了开源模型的巨大潜力及其在技术进步中的重要作用。

Source:https://www.aibase.com/news/10497