AI-NEWS · 2025年 10月 31日

IBM推边缘AI小模型

IBM发布Granite 4.0 Nano系列边缘AI模型

核心亮点

  • 模型定位:专为本地和边缘推理设计的小型模型系列
  • 开源许可:全部采用Apache 2.0许可证
  • 企业级认证:通过ISO42001认证,具备加密签名和治理能力

模型规格

架构特点

  • 混合架构:结合SSM(状态空间模型)与Transformer的混合架构
  • 两种变体
    • H变体:交替使用SSM层和Transformer层
    • Transformer变体:确保最大运行时兼容性

具体型号

型号 参数量 架构类型
Granite 4.0 H1B 约15亿参数 混合SSM架构
Granite 4.0 H350M 3.5亿参数 混合SSM架构
Granite 4.0 1B 约10亿参数 Transformer架构
Granite 4.0 350M 3.5亿参数 Transformer架构

技术优势

性能表现

  • 内存效率:相比纯Transformer架构,混合架构在内存增长方面优势显著
  • 通用性:保持了Transformer模块的通用性

训练数据

  • 训练规模:使用超过15万亿token进行训练
  • 训练方法:遵循大规模Granite 4.0模型的相同训练流程
  • 能力增强:经过指令调优,提升工具使用和指令遵循能力

性能对比

在与其他同类模型(Qwen、Gemma、LiquidAI LFM)的对比中,Granite 4.0 Nano系列在以下领域表现突出:

  • 通用知识
  • 数学能力
  • 代码生成
  • 安全性

应用场景

部署环境

  • 支持平台:vLLM、llama.cpp、MLX等流行运行时环境
  • 部署方式:边缘计算、本地部署、浏览器级别部署

任务表现

在以下评测中表现优异:

  • IFEval代理任务
  • Berkeley函数调用排行榜v3

获取方式

用户可通过以下平台获取模型:

  • Hugging Face
  • IBM watsonx.ai

目标用户

主要面向早期AI工程师和软件团队,帮助更好地实施AI项目

火龙果频道