AI-NEWS · 2024年 11月 27日

AI2发布新语言模型OLMo2挑战Meta的Llama

Ai2发布全新OLMo2系列:开放源代码AI的新里程碑

非营利性人工智能研究机构Ai2最近宣布了其新的OLMo2系列,这是“开放语言模型”(Open Language Model, OLMo)系列的第二代产品。OLMo2不仅为AI社区提供了强大的技术支持,还以其完全开源的特性代表了开源AI领域的最新发展。

与其他市场上所谓的“开放”语言模型不同,如Meta的Llama系列,OLMo2严格符合开源倡议的标准,这意味着用于开发该模型的所有训练数据、工具和代码都是公开且可被任何人使用的。根据开源倡议组织10月刚刚最终确定的标准,OLMo2完全满足了“开源AI”的标准。

OLMo2的主要特点

  • 全系列开放:在OLMo2的整个开发过程中,所有训练数据、代码、培训计划、评估方法以及中间检查点都是完全公开的。这旨在通过资源共享促进开放式社区中的创新和发现。
  • 参数规模:OLMo2包含两个版本,分别拥有70亿(OLMo7B)和130亿(OLMo13B)个参数。模型中参数的数量直接影响其性能,更多的参数通常意味着能够处理更复杂的任务。

性能与应用

在常见文本任务上,如回答问题、文档摘要生成和代码编写等方面,OLMo2的表现都非常出色。为了训练OLMo2,Ai2使用了一个包含五万亿个令牌的数据库。这些令牌是语言模型中的最小单位,一千万个令牌大约相当于75万字。训练数据包括高质量网站内容、学术论文、问答讨论板以及合成数学练习册,所有这些都是经过精心挑选以确保模型的有效性和准确性。

性能对比与授权

Ai2对其OLMo2的表现充满信心,并声称其性能可媲美Meta的Llama3.1等开源模型。值得注意的是,OLMo7B甚至超过了Llama3.18B,在一定程度上成为目前最强的完全开源语言模型之一。所有OLMo2模型及其组件都可以从Ai2官方网站免费下载,并且在Apache 2.0许可证下授权使用,这意味着这些模型既可用于研究也可用于商业应用。

![](Large Model Code Internet)
(图片来源:由Midjourney服务提供商授权生成)

Source:https://www.aibase.com/news/13522