前阿里巴巴通义千问(Qwen)的首席工程师林俊阳在离职后,第一次把自己这几年憋着的话说了出来。他指出了一个挺有意思的趋势:大模型正在从“光会想”变成“真能干活”。
以前大家一门心思琢磨怎么让模型多思考几步,好像思考得越久越聪明。但现在看来,光想不动手是没用的。未来的关键,得看模型能不能为了把事做成而思考,并且在跟真实世界打交道的过程中,不断调整自己的计划。
回想一下 Qwen 团队在 2025 年初的那次尝试,其实挺惨的。当时我们想搞个大一统的系统,试图根据问题难度自动切换“推理”和“指令”模式。结果呢?因为训练用的“推理数据”和“指令数据”底子完全不同,硬把它们揉在一起,模型表现直接拉胯。
具体是啥样?
- 让它思考的时候,它变得特别啰嗦,还不敢下结论,好像怕说错话。
- 让它干活的时候,它又变得小心翼翼,动不动就报错,而且成本还高得吓人。
这次“强行合并”的失败,直接决定了 Qwen 后来的路怎么走。后面他们干脆把模型拆开了:一个专门管听话(Instruct 版),一个专门管动脑(Thinking 版)。这算是给行业上了一课吧。
我也挺受触动的。以前总以为,推理链条拉得越长,模型越聪明。现在想想,这纯粹是在浪费算力。真正聪明的模型,应该是在“模型”和“环境”之间搭个桥,让它能去行动、去试错。毕竟,光在脑子里空想,再花哨也没啥用。}}}
