AI-NEWS · 2026年 5月 26日

中国大模型连续四周超越美国

根据 OpenRouter 的最新监测数据,最近四周全球大模型的调用量都在向“东方”倾斜。

上周(5 月 18 日至 24 日),全球 AI 大模型的总调用量达到了 28.9 万亿 Tokens,环比增长了 7.4%。这个增长势头已经保持了 5 周。

而具体到中美两国的对比,差距正在拉大:

  • 中国 AI 大模型的周调用量是 9.223 万亿 Tokens,环比暴涨了 19.89%。
  • 美国 AI 大模型的周调用量是 4.93 万亿 Tokens,虽然也增长了 16.27%,但增速明显慢于中国。

我的观察是: 数据很直白,AI 的使用已经变成了一种高频、日常的习惯。在算力和应用的双重比拼下,中国模型不仅在规模上跑赢了美国,而且增长速度更快。这确实说明全球 AI 的格局正在发生实质性变化。


为什么中国能突然“反超”并稳住第一的位置?我觉得背后主要有三个实际原因:

1. 性价比更高的“工业级”API

以前大家觉得美国模型性能强,但价格贵得吓人。现在的情况是,像智谱 AI 的 GLM 系列、DeepSeek、还有阿里的 Qwen 系列这些中国模型,在保证旗舰级性能的同时,价格却极具竞争力。

  • 实际好处:开发者能同时享受到“高智能、低延迟、低成本”。
  • 市场反应:这种优势很快抓住了全球开发者的眼球,特别是在对成本敏感的新兴市场,中国模型已经成了很多人的首选。

2. 真正嵌入了开发者的工作流

OpenRouter 的数据显示,中国大模型已经不再是可有可无的选项,而是更深地融入了开发者的日常:

  • 场景很广:从 AI Agent 开发、自动化编程到大规模内容生成,中国模型都能用,兼容性很高。
  • 路由更顺:随着中国模型在推理环境中的适配越来越好,海外开发者也更愿意把它放进“模型路由”的核心链条里,直接作为主力模型来用。

3. 产品策略更务实

5 月推出的一系列 AI 产品显示,中国 AI 产业的叙事逻辑变了:从单纯追求“模型参数排名”转向了“怎么帮客户省钱”。

  • 性能很实:比如字节跳动的 Minimax 系列推出了 Lance 3B 原生多模态模型,还有智谱 AI GLM-5.1 的 API 速度能达到 400 tokens/s
  • 解决真问题:能切实解决业务痛点的模型,用户粘性自然更强。

行业趋势:AI 基建正在走向“多极化”

虽然中国在调用量上领先,但行业分析师指出,这并不只是简单的“赢家通吃”,而是全球 AI 基础设施走向“多极化”的一个必然结果:

  • 中美双轨制:全球开发者已经习惯了同时调用中美两国的模型。针对不同任务负载选择最便宜的 API,这已经是开发者的基本操作了。
  • 算力与数据的双循环:调用量不仅仅是个数字,它更是训练数据和反馈循环的来源。
    • 正向反馈:中国持续的领先意味着中国 AI 获得了更多样化、全球化的语言反馈,这会加速中国模型的迭代。这就形成了一个 “调用量增加 → 性能提升 → 调用量再次增加” 的良性循环。

最后说句实在话: 全球 AI 的竞赛格局正在被重塑。中国大模型靠着生态优势、性价比以及务实的产品策略,正从“跟随者”慢慢变成“领跑者”,并且正在构建属于自己的一套全球性基础设施闭环。

火龙果频道