AI-NEWS · 2026年 3月 31日

豆包进全球前几?小米大模型首秀

智谱 AI 刚发了份新评测,里面有个叫 SuperCLUE 的榜单,挺有意思。

以前咱们总盯着“参数量”这个指标,觉得谁参数多谁就牛。但这次情况不太一样了。榜单显示,国产大模型在理解中文语境、常识推理这些方面进步明显,不再是单纯跟 GPT-4 比谁算力强。

最让我惊讶的是豆包(字节跳动的模型)。它现在能跟 GPT-4 掰手腕了,特别是在处理长文本和规划复杂任务上,表现比我想象中要好不少。当然,百度和阿里两家也没闲着,文心一言和通义千问依旧稳如泰山,看来大厂在语料库和技术积累上的优势短期内是甩不掉的。

不过,这次榜单里有个新面孔——小米的自研大模型 MiMo,居然也混进去了。说实话,看到它名字出现时我愣了一下。以前手机厂商做模型都是“画饼”,这次能进全球顶尖榜单,说明小米在“系统级调度”和“多设备协同”上确实有点真本事。这比那些只会堆参数的模型实在多了。

我个人的观察是,大模型的内卷方式正在变。以前是“参数卷”,现在变成了“场景卷”。

  • 字节靠的是流量和生态,做内容创作、社交互动挺顺手。
  • 小米靠的是手机硬件,能把 AI 塞进系统底层,多设备联动更丝滑。
  • 百度和阿里则是在吃“规模饭”,底层技术深厚,不容易出错。

未来谁笑到最后?我觉得关键看谁能把 AI 真正用进具体行业里,解决实际问题,而不是光看个数字。至于小米这种“端云协同”的路子,看着确实有搞头,毕竟手机端的延迟和成本问题,云端很难完美解决,但端侧模型能缓解不少。

总之,国产大模型这趟车算是跑顺了,虽然离真正的“国际顶尖”还有距离,但至少证明咱们这帮厂商不只会做手机了,开始玩“硬科技”了。

火龙果频道