小米开源多模态大模型MiMo-VL-7B-2508,四大核心能力创新高
模型概览
- 模型名称:Xiaomi MiMo-VL-7B-2508
- 版本类型:
- RL版本(强化学习版)
- SFT版本(监督微调版)
- 发布时间:2025年8月
核心性能突破
评测项目 | 得分 | 突破说明 |
---|---|---|
MMMU基准 | 70+ | 首次突破70分大关 |
ChartQA | 94.4 | 图表理解能力领先 |
ScreenSpot-v2 | 92.5 | 图形界面定位精准度提升 |
VideoMME | 70.8 | 视频理解能力显著改进 |
技术优化亮点
-
训练稳定性提升:
- VLM Arena内部评分从1093.9提升至1131.2
- SFT版本RL稳定性优于前代
-
交互模式创新:
- 思考模式:完整展示推理链(控制成功率100%)
- 直答模式:响应更快(成功率99.84%),通过"nothink"指令切换
版本推荐
- MiMo-VL-7B-RL-2508:推荐大多数用户使用
- MiMo-VL-7B-SFT-2508:适合需要自定义微调的场景