IBM推出Granite3.1：支持128K上下文长度

IBM发布新一代开源大型语言模型Granite3.1

IBM正式发布了其下一代开源大型语言模型Granite3.1，旨在占据企业AI领域的领先地位。这一系列的模型具有扩展至128K的上下文长度、嵌入模型、内置幻觉检测功能以及显著的性能改进。

图像13：IBM声称其Granite8B Instruct模型在同规模开源竞争对手中表现出色，包括Meta的Llama3.1、Qwen2.5和Google的Gemma2。
图像14

自10月份发布Granite3.0以来，IBM一直在快速迭代该系列。公司透露其与生成式AI相关的收入已达20亿美元。新版本的核心理念是将更多功能整合到更小的模型中，使企业用户能够更轻松、经济地运行这些模型。

上下文长度：Granite3.1的上下文长度显著提升至128K（从原来的4K），对于需要处理长文档、日志和对话的企业AI用户尤其重要。这一特点特别适用于检索增强生成(RAG)和智能代理AI。
嵌入模型：IBM还发布了一系列嵌入模型以加速数据向向量的转换过程，其中Granite-Embedding-30M-English模型的查询时间为0.16秒，超越了竞争产品。

目前，Granite3.1模型对企业用户免费提供，并通过IBM的Watsonx企业AI服务渠道发布。未来，IBM计划保持快速更新节奏，预计在2025年初发布的Granite3.2将引入多模态能力。