蚂蚁集团与乐聚机器人合作:到底想搞出个啥?
3 月 16 日,上海蚂蚁灵珀和深圳乐聚机器人签了个字。别急着觉得这是又一场“巨头结盟”的公关秀,这次看起来有点实在。
蚂蚁灵珀手里攥着“大脑”——也就是具身智能大模型,而乐聚手里是“身体”——机器人本体。以前它们俩虽然都在这行混,但更像是在各自的山头上练级。这次合作,简单说就是要把“大脑”装进“身体”里,在工厂或者商场这种真实环境里跑起来。
为什么是现在?数据够不够用?
这其实不是第一次合作。早在之前,乐聚就给蚂蚁的 LingBot-VLA 大模型喂过料——整整 1 万小时的高质量视频数据。你可以把这 1 万小时想象成给 AI 喂的“顶级教材”,没有这些数据,现在的模型根本学不会怎么在真实世界里干活。
所以这次签约,补上的恰恰是最后那块拼图:从“在电脑里跑”变成“在真机上跑”,也就是所谓的“硬件 – 场景 – 数据 – 算法”闭环。
最让我觉得有意思的是“一脑控多机”这个点。以前一个机器人得配一个大脑,成本高、扩展难。现在通过模型的能力,一个大脑能指挥好几个不同型号的机器人干活。这不仅仅是技术的突破,更是把具身智能从“玩具”变成“工具”的关键一步。
具体要干什么?别光听概念
很多报道喜欢用“赋能”、“深度融合”、“生态闭环”这种词,听起来高大上,但落地时往往是一锅粥。这次双方的规划倒是很直白:
- 接着造数据:继续收集更多真实场景下的机器人干活视频。这玩意儿太贵了,也是目前最大的瓶颈。
- 接着练模型:有了新数据,把模型再训练一遍,让它更聪明,适应更多场景。
- 接着改机器人:根据模型的需求,调整机器人的“身体”结构,让它能听懂、能听懂、能动手。
听起来是个死循环?其实这就是 AI 发展的必经之路。现在的机器人要么太笨(不懂环境),要么太贵(硬件太复杂)。双方想做的,就是让硬件更通用,让软件更聪明,最后套在一起用。
真的能成吗?还是又是画饼?
说实话,看多了这种新闻,第一反应往往是怀疑。
具身智能行业现在确实很火,但离真正的“通用智能”还有挺大距离。现在的模型大多是在仿真环境里练出来的,一到真实世界就“发疯”。这次合作的难点在于,能不能真的把 1 万小时的数据喂进去,练出一个能在各种工厂、各种仓库里随便用的模型?
如果最后出来的还是只能干单一任务,或者对光线、地面材质极其敏感,那所谓的“通用智能”可能就是个美丽的泡沫。
不过,从另一个角度看,这确实是行业的一个好信号。以前大家都在闭门造车,每家搞一套系统,互不兼容。这次大厂(蚂蚁)和硬科技厂商(乐聚)直接下场拼凑,说明行业开始意识到:光有算法不行,还得有硬件配合;光有硬件不行,还得有数据喂养。
特别是“一脑控多机”这个方向,如果能跑通,确实能大幅降低部署成本。以前你要买 10 个机器人就得配 10 套系统,以后可能只需要一套系统管 10 个机器人。这对想入局的企业来说,门槛确实低了不少。
写在最后
这场合作,与其说是技术上的完美融合,不如说是行业进入深水区的一个标志。它不再仅仅是实验室里的 PPT,而是开始往真金白银的投入走。
当然,路还很长。从“能跑”到“跑得好”,从“专用”到“通用”,中间还要踩不少坑。但至少,蚂蚁和乐聚这一步迈得还算对。咱们就等着看,年底或者明年,能不能看到真家伙使出来。
注:本文基于公开信息整理,技术细节可能随后续合作进展而变化。
