蚂蚁集团与乐聚机器人合作：到底想搞出个啥？

3 月 16 日，上海蚂蚁灵珀和深圳乐聚机器人签了个字。别急着觉得这是又一场“巨头结盟”的公关秀，这次看起来有点实在。

蚂蚁灵珀手里攥着“大脑”——也就是具身智能大模型，而乐聚手里是“身体”——机器人本体。以前它们俩虽然都在这行混，但更像是在各自的山头上练级。这次合作，简单说就是要把“大脑”装进“身体”里，在工厂或者商场这种真实环境里跑起来。

这其实不是第一次合作。早在之前，乐聚就给蚂蚁的 LingBot-VLA 大模型喂过料——整整 1 万小时的高质量视频数据。你可以把这 1 万小时想象成给 AI 喂的“顶级教材”，没有这些数据，现在的模型根本学不会怎么在真实世界里干活。

所以这次签约，补上的恰恰是最后那块拼图：从“在电脑里跑”变成“在真机上跑”，也就是所谓的“硬件 – 场景 – 数据 – 算法”闭环。

最让我觉得有意思的是“一脑控多机”这个点。以前一个机器人得配一个大脑，成本高、扩展难。现在通过模型的能力，一个大脑能指挥好几个不同型号的机器人干活。这不仅仅是技术的突破，更是把具身智能从“玩具”变成“工具”的关键一步。

很多报道喜欢用“赋能”、“深度融合”、“生态闭环”这种词，听起来高大上，但落地时往往是一锅粥。这次双方的规划倒是很直白：

听起来是个死循环？其实这就是 AI 发展的必经之路。现在的机器人要么太笨（不懂环境），要么太贵（硬件太复杂）。双方想做的，就是让硬件更通用，让软件更聪明，最后套在一起用。

说实话，看多了这种新闻，第一反应往往是怀疑。

具身智能行业现在确实很火，但离真正的“通用智能”还有挺大距离。现在的模型大多是在仿真环境里练出来的，一到真实世界就“发疯”。这次合作的难点在于，能不能真的把 1 万小时的数据喂进去，练出一个能在各种工厂、各种仓库里随便用的模型？

如果最后出来的还是只能干单一任务，或者对光线、地面材质极其敏感，那所谓的“通用智能”可能就是个美丽的泡沫。

不过，从另一个角度看，这确实是行业的一个好信号。以前大家都在闭门造车，每家搞一套系统，互不兼容。这次大厂（蚂蚁）和硬科技厂商（乐聚）直接下场拼凑，说明行业开始意识到：光有算法不行，还得有硬件配合；光有硬件不行，还得有数据喂养。

特别是“一脑控多机”这个方向，如果能跑通，确实能大幅降低部署成本。以前你要买 10 个机器人就得配 10 套系统，以后可能只需要一套系统管 10 个机器人。这对想入局的企业来说，门槛确实低了不少。

这场合作，与其说是技术上的完美融合，不如说是行业进入深水区的一个标志。它不再仅仅是实验室里的 PPT，而是开始往真金白银的投入走。

当然，路还很长。从“能跑”到“跑得好”，从“专用”到“通用”，中间还要踩不少坑。但至少，蚂蚁和乐聚这一步迈得还算对。咱们就等着看，年底或者明年，能不能看到真家伙使出来。

注：本文基于公开信息整理，技术细节可能随后续合作进展而变化。

近期新闻