豆包进全球前几？小米大模型首秀

智谱 AI 刚发了份新评测，里面有个叫 SuperCLUE 的榜单，挺有意思。

以前咱们总盯着“参数量”这个指标，觉得谁参数多谁就牛。但这次情况不太一样了。榜单显示，国产大模型在理解中文语境、常识推理这些方面进步明显，不再是单纯跟 GPT-4 比谁算力强。

最让我惊讶的是豆包（字节跳动的模型）。它现在能跟 GPT-4 掰手腕了，特别是在处理长文本和规划复杂任务上，表现比我想象中要好不少。当然，百度和阿里两家也没闲着，文心一言和通义千问依旧稳如泰山，看来大厂在语料库和技术积累上的优势短期内是甩不掉的。

不过，这次榜单里有个新面孔——小米的自研大模型 MiMo，居然也混进去了。说实话，看到它名字出现时我愣了一下。以前手机厂商做模型都是“画饼”，这次能进全球顶尖榜单，说明小米在“系统级调度”和“多设备协同”上确实有点真本事。这比那些只会堆参数的模型实在多了。

我个人的观察是，大模型的内卷方式正在变。以前是“参数卷”，现在变成了“场景卷”。

未来谁笑到最后？我觉得关键看谁能把 AI 真正用进具体行业里，解决实际问题，而不是光看个数字。至于小米这种“端云协同”的路子，看着确实有搞头，毕竟手机端的延迟和成本问题，云端很难完美解决，但端侧模型能缓解不少。

总之，国产大模型这趟车算是跑顺了，虽然离真正的“国际顶尖”还有距离，但至少证明咱们这帮厂商不只会做手机了，开始玩“硬科技”了。

近期新闻