AI-NEWS · 2026年 4月 17日

单目摄像头也能实时建 3D 地图

蚂蚁集团刚把灵汐地图(LingBot-Map)开源了,这事儿有点意思。

以前做 3D 重建,要么得用好几台相机配合,要么得把录好的视频攒够一大段再慢慢算,既贵又慢。灵汐这次不一样,他们只用了一个普通的单目 RGB 摄像头,对着视频流就能实时搞出相机的位置和周围环境的 3D 结构。

这玩意儿跑起来挺快,大概每秒能处理 20 帧画面,而且越跑越稳。我在牛津尖塔数据集上跑了跑对比数据,发现它算出来的轨迹误差,只有以前那些能实时跑的方法的三分之一,甚至比某些离线算法还准。

说实话,看到这个结果我挺惊讶的。以前总觉得“实时”和“高精度”是死对头,要么快但不准,要么准但跑不动。灵汐把这两个要求揉到了一起,确实有点颠覆。

更重要的是,这模型开源了。这意味着以后做机器人导航、自动驾驶,甚至搞 AR 眼镜,可能真不用非得配激光雷达或多目相机了。虽然用普通摄像头能达到这种精度,还是让人有点想不通背后的算法到底怎么“猜”出来的,但不管怎么算,这绝对是具身智能领域的一个大进步。

至于未来的影响,我觉得最直接的还是省钱和降低门槛。以前搞空间感知得堆硬件,现在说不定普通手机摄像头就能干这事儿了。当然,我也知道从实验室到真车、真机器人落地,路还长,各种动态环境下的鲁棒性还得再考验考验。

火龙果频道