AI-NEWS · 2025年 11月 23日

小米开源大模型

小米发布具身智能大模型MiMo-Embodied并全面开源

核心要点

  • 发布时间:2025年11月22日
  • 发布方:小米公司
  • 模型名称:MiMo-Embodied
  • 重要决策:模型将全面开源

技术背景与研发动机

随着具身智能在家庭场景落地和自动驾驶技术规模化应用,行业面临关键挑战:

  • 机器人、车辆如何实现认知与能力互通
  • 室内操作智能与户外驾驶智能能否相互促进

MiMo-Embodied正是为解决这些问题而开发,成功连接了自动驾驶与具身智能两大领域。

核心技术亮点

1. 跨领域能力覆盖

  • 具身智能三大核心任务
    • 可供性推理
    • 任务规划
    • 空间理解
  • 自动驾驶三大关键任务
    • 环境感知
    • 状态预测
    • 驾驶规划

2. 知识迁移验证

  • 验证了室内交互能力与道路决策能力之间的知识转移和协同效应
  • 为跨场景智能融合提供新思路

3. 多阶段训练策略

采用"具身驾驶能力学习 → CoT推理增强 → RL微调"的训练流程,有效提升模型在真实环境中的部署可靠性。

性能表现

基准测试成绩

在29项核心基准测试中,MiMo-Embodied为开源基模型设立了新的性能标杆:

具身智能领域

  • 在17个基准测试中达到SOTA水平
  • 重新定义了任务规划、可供性预测和空间理解的边界

自动驾驶领域

  • 在12个基准测试中表现优异
  • 实现环境感知、状态预测和驾驶规划的全链条性能突破

通用视觉语言领域

  • 展现出优秀的泛化能力
  • 在强化通用感知和理解能力的同时,在多个关键基准上实现显著性能提升

开源信息

  • 开源地址:MiMo-Embodied大模型
  • 模型完全开放,支持研究社区使用和发展

战略意义

此次发布标志着小米在通用具身智能研究领域迈出重要一步,从"垂直领域专用"向"跨领域能力协同"实现关键突破。

火龙果频道