AI-NEWS · 2025年 8月 10日

小米开源多模态大模型

小米开源多模态大模型MiMo-VL-7B-2508,四大核心能力创新高

模型概览

  • 模型名称:Xiaomi MiMo-VL-7B-2508
  • 版本类型
    • RL版本(强化学习版)
    • SFT版本(监督微调版)
  • 发布时间:2025年8月

核心性能突破

评测项目 得分 突破说明
MMMU基准 70+ 首次突破70分大关
ChartQA 94.4 图表理解能力领先
ScreenSpot-v2 92.5 图形界面定位精准度提升
VideoMME 70.8 视频理解能力显著改进

技术优化亮点

  1. 训练稳定性提升

    • VLM Arena内部评分从1093.9提升至1131.2
    • SFT版本RL稳定性优于前代
  2. 交互模式创新

    • 思考模式:完整展示推理链(控制成功率100%)
    • 直答模式:响应更快(成功率99.84%),通过"nothink"指令切换

版本推荐

  • MiMo-VL-7B-RL-2508:推荐大多数用户使用
  • MiMo-VL-7B-SFT-2508:适合需要自定义微调的场景

火龙果频道