AI-NEWS · 2026年 3月 4日

蚂蚁发布实体智能数据框架

蚂蚁数科发布低成本具身智能数据采集框架AoE

核心摘要

蚂蚁集团旗下蚂蚁数科的天玑实验室团队,近期在具身智能(Embodied Intelligence)的真实世界数据采集技术上取得重要突破。团队发布了一种名为 AoE(Always-On Egocentric) 的连续第一人称视频采集框架。该框架以极低的成本(一部智能手机和一个不到20元的颈挂支架)替代了以往动辄数万元的专业设备,实现了高质量的具身智能数据采集,有效解决了数据采集成本高、规模化难的行业痛点。相关技术论文已发布于Arxiv。

技术方案详解

1. 低成本硬件载体

  • 核心设备:普通智能手机 + 低成本颈挂支架(机械卡扣与磁吸固定)。
  • 工作方式:将手机固定在用户胸前,持续采集接近用户视角的第一人称视频,完整记录自然的交互过程。
  • 核心理念:将“人+手机”转化为可持续的数据采集节点。

2. 关键技术性能

  • 轨迹精度:保持毫米级轨迹精度。
  • 手势识别:手部关键点识别准确率超过90%。
  • 规模化能力:支持数千台设备并发数据采集与自动化云端处理。

3. 数据效能验证

一项在宇树科技G1机器人上进行的“关闭电脑”任务测试显示:

  • 仅使用50个远程操作数据点:任务成功率为 45%
  • 引入200个AoE采集的数据点后:任务成功率跃升至 95%
  • 结论:在数据稀缺阶段,AoE数据对模型“启动学习”起到了关键作用。

4. 自动化数据处理流水线

AoE框架不仅解决采集问题,更攻克了“长视频转训练数据”的技术挑战:

  1. 边缘触发:在手机端使用轻量视觉模型,自动识别手-物交互并触发录制。
  2. 语义分割:利用大语言视觉模型,将连续视频分割成带有语义标签的原子动作片段。
  3. 云端处理:通过自动标注、过滤和清洗,将手机视频自动转化为高质量、标准化的训练数据。
  4. 端云协同:构建了从数据采集、预处理、清洗、筛选到调度的全流程自动化处理方案,减少人工干预,提升整体吞吐效率。

背景与战略意义

  • 行业需求:随着基础模型发展,其泛化能力和跨场景适应力越来越依赖于真实世界交互数据的规模、质量和覆盖面。
  • 公司战略:蚂蚁数科正持续加大对AI to B的投入。其天玑实验室聚焦于AIdata(AI数据)、AIsecurity(AI安全)、AIfinance(AI金融)、AIembodied intelligence(AI具身智能)等领域,加速科技成果转化与应用。
  • 近期动态:自2026年初以来,蚂蚁数科在AI领域动作频繁,此前已宣布成立“大模型技术创新部”,并计划推出企业级大模型产品。

相关行业动态(摘要)

  1. Meta测试AI购物助手:利用30亿社交档案数据进行精准推荐,标志着大模型竞争从内容创作向电商领域延伸。(2026-03-03)
  2. 联想发布多款AI概念硬件:在MWC 2026上推出包括具身智能桌面助手“AI Workmate”在内的六款概念设备。(2026-03-03)
  3. 2025年AI应用MAU排名:QuestMobile报告显示,豆包、DeepSeek、元宝、蚂蚁语雀、阿里通义千问位列前五。(2026-03-03)
  4. 银河通用完成25亿元融资:具身智能公司银河通用完成融资,标志着国家大基金三期在该领域的首笔投资落地。(2026-03-02)
  5. 中国电信投资面壁智能:共同构建大模型算力与数据基础设施,加速国产大模型在公共数据、智能硬件等领域的商业化。(2026-03-02)

注:本文核心信息整理自AIbase于2026年3月3日的报道。

火龙果频道