AI-NEWS · 2026年 4月 1日

小米大模型排全球第五,雷军话术变了

2026 年 3 月 31 日,雷军发话了。自研的大模型 MiMo-V2-Pro 在 Text Arena 这个号称“大模型高考”的榜单上,硬是挤进了全球前五。

说实话,看到这个消息心里挺复杂的。一方面,能在逻辑推理和长指令这种硬核指标上跟 OpenAI、Anthropic 掰手腕,确实说明咱们技术追上来了。另一方面,我也忍不住想:这次是真的“上岸”了,还是又是那种“刷榜”出来的虚名?

好在 Text Arena 这次玩的是“双盲测试”。用户看不见模型名字,打完字直接投票。这种机制至少骗不了人。

排名这东西,得看跟谁比。
在 ArenaExpert(专家打分)维度,小米实验室排全球第四;在代码能力上排第五。如果把这些数据加在一起,小米确实坐稳了全球前五的位置。

最让我意外的是热度。
自 3 月 19 日放出旗舰版 MiMo-V2-Pro 以来,它在 OpenRouter 上的调用量一直霸榜。不管是日榜还是周榜,都是第一。这说明开发者是真在用,而不是拿来做样子。

钱花得值不值?
雷军之前拍着胸脯说,未来三年砸 60 亿 搞 AI。现在看,这笔钱没白花。HyperOS 系统级 AI 功能正在推,Xiaomi MiMo Agent 框架也全生态开放了,想搞“人车家”全智能,这底牌算是亮出来了。

还有一个实惠:
官方把开发者免费试用期从一周延长到了两周,截止时间是 4 月 2 日 24:00。想试试水、看看这模型到底成色如何的,这几天正好是窗口期。

我怎么看这事儿?
雷军这次的态度跟以前不太一样。以前总盯着榜单排名,现在他说“不再看榜单,只看用户投票”。这话听着顺耳,但也挺扎心。

以前大家争来争去,最后发现参数规模越大越好,或者在那几个闭集数据集上刷高分,结果用户根本用不起来。现在小米似乎悟了:分数再高,用户不投票就是零。

这其实是个信号。AI 行业的“内卷”可能要从单纯的比参数、刷分数,转向看谁能真正解决实际问题,谁能留住用户。

至于能不能一直这么稳?毕竟 AI 这行当,变数还是太大。但至少现在,小米算是把话挑明了:别跟我谈虚的,让用户说了算。

火龙果频道