小米发布具身智能大模型MiMo-Embodied并全面开源
核心要点
- 发布时间:2025年11月22日
- 发布方:小米公司
- 模型名称:MiMo-Embodied
- 重要决策:模型将全面开源
技术背景与研发动机
随着具身智能在家庭场景落地和自动驾驶技术规模化应用,行业面临关键挑战:
- 机器人、车辆如何实现认知与能力互通
- 室内操作智能与户外驾驶智能能否相互促进
MiMo-Embodied正是为解决这些问题而开发,成功连接了自动驾驶与具身智能两大领域。
核心技术亮点
1. 跨领域能力覆盖
- 具身智能三大核心任务:
- 可供性推理
- 任务规划
- 空间理解
- 自动驾驶三大关键任务:
- 环境感知
- 状态预测
- 驾驶规划
2. 知识迁移验证
- 验证了室内交互能力与道路决策能力之间的知识转移和协同效应
- 为跨场景智能融合提供新思路
3. 多阶段训练策略
采用"具身驾驶能力学习 → CoT推理增强 → RL微调"的训练流程,有效提升模型在真实环境中的部署可靠性。
性能表现
基准测试成绩
在29项核心基准测试中,MiMo-Embodied为开源基模型设立了新的性能标杆:
具身智能领域:
- 在17个基准测试中达到SOTA水平
- 重新定义了任务规划、可供性预测和空间理解的边界
自动驾驶领域:
- 在12个基准测试中表现优异
- 实现环境感知、状态预测和驾驶规划的全链条性能突破
通用视觉语言领域:
- 展现出优秀的泛化能力
- 在强化通用感知和理解能力的同时,在多个关键基准上实现显著性能提升
开源信息
- 开源地址:MiMo-Embodied大模型
- 模型完全开放,支持研究社区使用和发展
战略意义
此次发布标志着小米在通用具身智能研究领域迈出重要一步,从"垂直领域专用"向"跨领域能力协同"实现关键突破。
