AI-NEWS · 2025年 8月 27日

智跑手机

智能手机也能运行!面壁智能发布MiniCPM-V4.5:4.1亿参数超越GPT-4.1-mini

模型发布背景

面壁智能(FaceWall Intelligence)与清华大学自然语言处理实验室合作,于2025年8月26日正式推出最新边缘侧多模态大模型MiniCPM-V4.5,标志着边缘AI技术达到新高度。

技术突破:参数更少,性能更强

核心架构

  • 视觉模块:基于SigLIP2-400M
  • 语言模型:基于MiniCPM4-3B
  • 总参数量:仅4.1亿参数

性能表现

在OpenCompass综合评估中:

  • 平均得分:69.0分
  • 对比表现
    • 超越GPT-4.1-mini(64.5分)
    • 超越Qwen2.5-VL-3B-Instruct(64.5分)
  • 与前代对比:相比MiniCPM-V2.6(8.1亿参数,65.2分),性能显著提升的同时大幅减少参数量

增强的多模态能力:全面支持视觉、文本和视频

视觉处理能力

  • 分辨率支持:最高180万像素(1344×1344)
  • 任意宽高比:完全支持
  • OCR性能:在OCRBench基准测试中超越GPT-4o和Gemini 1.5 Pro等主流专有模型

多图像与视频理解

  • 基准测试表现:在Mantis-Eval、BLINK、Video-MME等基准中展现领先能力
  • 应用场景:适用于复杂场景下的多图像推理和视频时空信息处理

多语言支持

  • 支持语言:超过30种语言
  • 涵盖语种:英语、中文、德语、法语、意大利语、韩语等
  • 用户体验:为全球用户提供无缝的多模态交互体验

高效部署:针对边缘设备优化

性能优势

  • token密度:处理180万像素图像仅需640个视觉token
  • 效率提升:相比大多数模型减少75%的视觉token使用量

移动设备表现(iPhone 16 Pro Max测试)

  • 首token延迟:小于2秒
  • 解码速度:超过17 tokens/秒
  • 发热控制:无明显过热问题

部署支持

  • 部署方式:支持llama.cpp、Ollama、vLLM、SGLang等多种方式
  • 平台支持:提供iOS应用支持
  • 适用场景:满足移动、离线和隐私保护需求

开放生态:推动学术与商业创新

开源策略

  • 许可协议:Apache 2.0开源协议
  • 学术使用:完全开源
  • 商业使用:简单注册后免费使用

社区影响

  • 下载量:在GitHub和HuggingFace累计超过100万次下载
  • 行业地位:成为边缘AI领域的标杆模型

应用前景与行业影响

应用场景

  • 实时视频分析
  • 智能文档处理
  • 多语言交互
  • 教育、医疗、内容创作等行业

发展趋势

随着边缘侧算力的快速提升和模型效率的持续优化,MiniCPM-V4.5有望成为边缘设备上的"新常态",与云端AI相媲美。

项目信息

  • 项目名称:MiniCPM-V4.5
  • 发布时间:2025年8月26日
  • 开发团队:面壁智能与清华大学NLP实验室

火龙果频道