AI-NEWS · 2024年 7月 23日

震惊AI界！Llama 3.1泄露：4050亿参数的开源巨兽来袭！

Llama 3.1模型泄露事件总结

主要内容

泄露信息：Llama 3.1模型由Meta开发，拥有4050亿参数，被认为是最接近GPT-4o的开源模型。
社区反响：泄露版本在Reddit上引起轩然大波，开源社区对其表现出极大的兴趣和讨论。

性能分析

基准测试结果：即使是70B版本的Llama 3.1，在多个基准测试中也超越了GPT-4o。此为开源模型首次在多个benchmark上达到SOTA水平，显示出强大的开源力量。

模型亮点

训练数据：使用超过15T+ tokens进行训练，预训练数据截止日期为2023年12月。
多语言支持：支持包括英语、法语、德语、印地语、意大利语、葡萄牙语、西班牙语和泰语在内的多种语言，在多语言对话用例中表现出色。
安全性措施：采用多方面的数据收集方法，包括人工生成数据与合成数据，结合边界prompt和对抗性prompt，以减轻潜在的安全风险。

总结

Llama 3.1的泄露展示了一个强大且多功能的开源大型语言模型，其在性能和多语言支持方面都有显著优势。虽然官方尚未发布，但其已经在多个基准测试中取得了优异成绩，甚至超越了一些闭源模型如GPT-4o。这一事件突显了开源模型的巨大潜力及其在技术进步中的重要作用。

Source:https://www.aibase.com/news/10497

您可能还喜欢...