AI-NEWS · 2026年 1月 28日

机器人可精准抓取透明物体

Ant LingBot-Depth:开源空间感知模型,助力机器人精准抓取透明与反光物体

概述

2026年1月27日,蚂蚁集团旗下的具身智能公司灵波科技(Ant Lingbo Technology)宣布开源高精度空间感知模型 LingBot-Depth。该模型基于Orobote Gemini330系列立体3D相机提供的芯片级原始数据,旨在提升环境深度感知与三维空间理解能力,为机器人、自动驾驶车辆等智能终端提供更精准可靠的三维视觉,在三维世界“看得清”这一行业关键挑战上实现重要突破。这也是灵波科技自2025年外滩大会亮相后,在具身智能技术底座领域公布的首个重要成果。

技术突破与性能表现

权威基准测试领先

在NYUv2、ETH3D等权威基准评估中,LingBot-Depth展现出代际优势:

  • 室内场景相对误差(REL):相较于PromptDA、PriorDA等主流行业方案,降低超过70%。
  • 稀疏SfM任务RMSE误差:在极具挑战性的稀疏深度补全任务中,降低约47%,树立了新的行业精度标准。

攻克透明与反光物体感知难题

在家庭和工业环境中,玻璃器皿、镜子、不锈钢设备等透明与高反光物体非常普遍,但对机器空间感知构成挑战。传统深度相机受光学物理特性限制,面对此类材料时常无法接收到有效回波,导致深度图数据缺失或噪声。

LingBot-Depth的解决方案

  1. 核心技术:开发了“掩码深度建模”(Masked Depth Modeling, MDM)技术。
  2. 数据基础:利用Orobote Gemini330系列立体3D相机进行RGB-Depth数据采集与验证。
  3. 推理能力:当深度数据缺失或异常时,模型能融合彩色图像(RGB)的纹理、轮廓和上下文信息,推断并补全缺失区域,输出完整、密集且边缘更清晰的三维深度图。

实际应用效果

  • 认证水平:该模型已通过Orobote深度视觉实验室的专业认证,在复杂场景的精度、稳定性和适应性上达到行业领先水平。
  • 场景测试:在透明玻璃、高反光镜面、强逆光、复杂曲面等挑战性光学场景下,应用LingBot-Depth的Orobote Gemini330系列仍能输出平滑、完整的深度图,物体轮廓非常锐利。
  • 性能对比:其表现显著超过行业领先的3D视觉公司Stereolabs的ZED Stereo Depth 3D相机。这意味着无需更换传感器硬件,LingBot-Depth即可大幅提升消费级深度相机对困难物体的处理效果。

数据支撑与开源计划

LingBot-Depth的优秀性能源于海量的真实场景数据:

  • 数据规模:灵波科技收集了约1000万原始样本,并提炼出200万对高价值深度数据用于训练,支撑了模型在极端条件下的泛化能力。
  • 核心数据资产开源:包含200万真实世界深度数据和100万仿真数据的核心数据资产即将开源,以帮助社区更快克服复杂场景感知挑战。

合作与未来展望

  1. 战略合作:蚂蚁灵波科技已与Orobote达成战略合作意向。Orobote计划基于LingBot-Depth的能力推出新一代深度相机。
  2. 持续开源:本周内,蚂蚁灵波将在具身智能方向逐步开源多个模型。

行业背景(同期其他动态摘要)

  • 触觉感知数据集:全球首个跨本体视觉-触觉大模型数据集“白虎-VTouch”发布,包含超6万分钟跨模态视觉-触觉数据,旨在助力提升机器人触觉感知。
  • 机器人亮相春晚:宇树科技正式宣布成为2026年央视春晚机器人合作伙伴,这将是其第三次登上春晚舞台。
  • 企业动态:MiniMax全资收购广州希遇极智,加速AI硬件与机器人商业化;智元机器人将其灵巧手业务分拆为新公司“临界点”并已获融资。
  • AI应用拓展:蚂蚁集团AI助手“灵光”HarmonyOS版已覆盖12大应用市场;奇瑞发布“摩卡”机器人,推动具身智能从工厂走向街道;AI健康领域竞争加剧,蚂蚁“安安”月活超3000万,OpenAI紧急推出ChatGPT Health。

信息来源:AIbase,2026年1月27日

火龙果频道