Ai2发布全新OLMo2系列：开放源代码AI的新里程碑

非营利性人工智能研究机构Ai2最近宣布了其新的OLMo2系列，这是“开放语言模型”（Open Language Model, OLMo）系列的第二代产品。OLMo2不仅为AI社区提供了强大的技术支持，还以其完全开源的特性代表了开源AI领域的最新发展。

与其他市场上所谓的“开放”语言模型不同，如Meta的Llama系列，OLMo2严格符合开源倡议的标准，这意味着用于开发该模型的所有训练数据、工具和代码都是公开且可被任何人使用的。根据开源倡议组织10月刚刚最终确定的标准，OLMo2完全满足了“开源AI”的标准。

OLMo2的主要特点

全系列开放：在OLMo2的整个开发过程中，所有训练数据、代码、培训计划、评估方法以及中间检查点都是完全公开的。这旨在通过资源共享促进开放式社区中的创新和发现。
参数规模：OLMo2包含两个版本，分别拥有70亿（OLMo7B）和130亿（OLMo13B）个参数。模型中参数的数量直接影响其性能，更多的参数通常意味着能够处理更复杂的任务。

性能与应用

在常见文本任务上，如回答问题、文档摘要生成和代码编写等方面，OLMo2的表现都非常出色。为了训练OLMo2，Ai2使用了一个包含五万亿个令牌的数据库。这些令牌是语言模型中的最小单位，一千万个令牌大约相当于75万字。训练数据包括高质量网站内容、学术论文、问答讨论板以及合成数学练习册，所有这些都是经过精心挑选以确保模型的有效性和准确性。

性能对比与授权

Ai2对其OLMo2的表现充满信心，并声称其性能可媲美Meta的Llama3.1等开源模型。值得注意的是，OLMo7B甚至超过了Llama3.18B，在一定程度上成为目前最强的完全开源语言模型之一。所有OLMo2模型及其组件都可以从Ai2官方网站免费下载，并且在Apache 2.0许可证下授权使用，这意味着这些模型既可用于研究也可用于商业应用。

![](Large Model Code Internet)
(图片来源：由Midjourney服务提供商授权生成)

Source:https://www.aibase.com/news/13522

近期新闻

AI-NEWS · 2024年 11月 27日

AI2发布新语言模型OLMo2挑战Meta的Llama

Ai2发布全新OLMo2系列：开放源代码AI的新里程碑

OLMo2的主要特点

性能与应用

性能对比与授权

您可能还喜欢...

AI-NEWS · 2024年 11月 27日

Ai2发布全新OLMo2系列：开放源代码AI的新里程碑

OLMo2的主要特点

性能与应用

性能对比与授权

您可能还喜欢...

Meta豪掷2000亿建AI中心

AI技术创造全球首个虚拟人细胞

Gemini 3.0下周发布