AI-NEWS · 2024年 12月 19日

IBM推出Granite3.1:支持128K上下文长度

IBM发布新一代开源大型语言模型Granite3.1

IBM正式发布了其下一代开源大型语言模型Granite3.1,旨在占据企业AI领域的领先地位。这一系列的模型具有扩展至128K的上下文长度、嵌入模型、内置幻觉检测功能以及显著的性能改进。

性能对比

  • 图像13:IBM声称其Granite8B Instruct模型在同规模开源竞争对手中表现出色,包括Meta的Llama3.1、Qwen2.5和Google的Gemma2。
  • 图像14

快速迭代与商业成功

自10月份发布Granite3.0以来,IBM一直在快速迭代该系列。公司透露其与生成式AI相关的收入已达20亿美元。新版本的核心理念是将更多功能整合到更小的模型中,使企业用户能够更轻松、经济地运行这些模型。

功能改进

  • 上下文长度:Granite3.1的上下文长度显著提升至128K(从原来的4K),对于需要处理长文档、日志和对话的企业AI用户尤其重要。这一特点特别适用于检索增强生成(RAG)和智能代理AI。
  • 嵌入模型:IBM还发布了一系列嵌入模型以加速数据向向量的转换过程,其中Granite-Embedding-30M-English模型的查询时间为0.16秒,超越了竞争产品。

幻觉检测

  • Granite3.1集成了内置幻觉检测功能,能自我识别并减少错误输出。这一特性优化了整体效率,并减少了推理调用次数。

未来规划

目前,Granite3.1模型对企业用户免费提供,并通过IBM的Watsonx企业AI服务渠道发布。未来,IBM计划保持快速更新节奏,预计在2025年初发布的Granite3.2将引入多模态能力。

Source:https://www.aibase.com/news/14095