从“想”到“做”：大模型演进路

前阿里巴巴通义千问（Qwen）的首席工程师林俊阳在离职后，第一次把自己这几年憋着的话说了出来。他指出了一个挺有意思的趋势：大模型正在从“光会想”变成“真能干活”。

以前大家一门心思琢磨怎么让模型多思考几步，好像思考得越久越聪明。但现在看来，光想不动手是没用的。未来的关键，得看模型能不能为了把事做成而思考，并且在跟真实世界打交道的过程中，不断调整自己的计划。

回想一下 Qwen 团队在 2025 年初的那次尝试，其实挺惨的。当时我们想搞个大一统的系统，试图根据问题难度自动切换“推理”和“指令”模式。结果呢？因为训练用的“推理数据”和“指令数据”底子完全不同，硬把它们揉在一起，模型表现直接拉胯。

具体是啥样？

这次“强行合并”的失败，直接决定了 Qwen 后来的路怎么走。后面他们干脆把模型拆开了：一个专门管听话（Instruct 版），一个专门管动脑（Thinking 版）。这算是给行业上了一课吧。

我也挺受触动的。以前总以为，推理链条拉得越长，模型越聪明。现在想想，这纯粹是在浪费算力。真正聪明的模型，应该是在“模型”和“环境”之间搭个桥，让它能去行动、去试错。毕竟，光在脑子里空想，再花哨也没啥用。}}}

近期新闻