智元机器人 GO-2:真的能干活了
上周,智元机器人(Zhiyuan Robotics)把他们的具身基座大模型 GO-2 推出来了。说实话,看到"刷新标杆"这种标题的时候,我心里稍微有点打鼓——毕竟这行当里吹牛太容易了。但这次,GO-2 似乎真的有点东西,至少它试图解决一个让所有同行头秃的老大难问题:听懂了,但做不对。
1. 终于不再“听风就是雨”
以前的机器人是什么德行?你让它在桌子上拿个杯子,它要么直接瞎扑腾,要么在那儿傻等人类去扶它。GO-2 试图改变这种“看即做”的盲动模式,搞了个叫 “动作思维链” 的东西。
简单来说,就是让机器人先在脑子里“预演”一遍。就像你教孩子投篮,不会直接扔,而是先让他想好手腕怎么压、脚怎么站。GO-2 接收指令后,会在内部生成一串结构化的动作计划。这一招确实管用,至少保证了动作路径是连贯的,不会半路把自己绊倒。
2. 脑子要慢,手脚要快
最让我觉得有意思的是它的架构设计,分成了两个系统:
- 慢系统:负责想事儿,定大方向。
- 快系统:负责干活,微调细节。
这就像开车,导航系统(慢)负责规划路线,而你的手和脚(快)负责根据路况实时打方向盘。如果只有一个系统,要么想得太久反应不过来,要么手快脚慢直接撞墙。GO-2 这种“异步双系统”的设计,至少让机器人在面对桌子歪了、东西滑了这种突发状况时,还能稳住不崩盘。
3. 数据确实有点“凡尔赛”
性能测试这块,GO-2 的表现确实有点夸张。在 LIBERO 等主流榜单上,它直接拿了第一。更离谱的是,在标准环境下,它的任务成功率达到了 98.5%。
我稍微查了一下资料,这数字比之前的 S1 模型高了接近 10 个百分点。这意味着什么?意味着它不再是个只能在实验室里乖乖听话的“电子宠物”,而是真能在有点乱的家里把东西收拾整齐了。哪怕光线忽明忽暗,或者背景有点噪音,它居然还能保持那种稳定的执行力。
4. 别光看热闹,真能落地吗?
智元机器人这次没光发个模型文件,而是搞了个 Genie Studio 平台。这倒是个聪明招数,直接把模型训练和现实部署串起来了。
理论上,这意味着开发者可以用云端数据去“喂”这个模型,让它越用越聪明。但咱们得保持清醒:实验室里的 98.5% 成功率,到了用户那满是灰尘、杂乱无章的家里,会不会打个七折?
写在最后
GO-2 的发布确实是个转折点。它证明了具身智能不再是纸上谈兵,至少现在连“理解”和“执行”这道坎儿,它算是跨过去了。
不过,别指望明天就能买到一个能在你家厨房熟练切菜、还能一边切一边跟你聊天的机器人。技术从“行”到“稳”,从“稳”到“真香”,中间还有很长一段路要走。但至少,这盏灯亮起来了,总比一片漆黑强。
