AI-NEWS · 2026年 2月 5日

2025全球大模型榜发布

2025全球中文大模型排行榜发布:海外巨头包揽前三,国产大模型在细分领域实现超越

报告概览

SuperCLUE于2026年2月4日正式发布《2025年度中文大模型基准评测报告》。本次评测汇集了23款国内外顶尖模型,覆盖数学推理、代码生成、科学推理等六大核心维度,直观展示了各大模型在中文语境下的实际“战斗力”。

整体排名与格局

海外模型保持领先优势

从整体排名看,海外闭源模型仍显示出强大统治力:

  1. 冠军:Anthropic的Claude-Opus-4.5-Reasoning,得分68.25
  2. 亚军:Google的Gemini-3-Pro-Preview。
  3. 季军:OpenAI的GPT-5.2(高配版)。

这三家巨头构成了“第一梯队”,在逻辑严谨性和综合理解力上保持微弱优势。

国产模型加速追赶,表现亮眼

国产大模型正以前所未有的速度缩小差距:

  • 开源模型领头羊:Kimi-K2.5-Thinking(全球排名第四)。
  • 闭源模型代表:Qwen3-Max-Thinking(全球排名第六)。

关键突破:国产模型在细分领域登顶

评测显示,国产模型已在特定领域实现“局部突破”:

  1. 代码生成Kimi 获得全球第一名
  2. 数学推理Qwen3Google 并列全球冠军

国内外市场呈现差异化竞争态势

领域 竞争格局 说明
闭源领域 海外领先,国产追赶 海外模型目前整体占优,但国产模型正在快速跟进。
开源领域 国产绝对领先 国内开源模型前五名的表现显著优于海外同类模型,展现了国内大模型生态在开放协作方面的独特优势。

这种“开源与闭源共同发展”的局面,标志着中国AI生态正进入高质量发展阶段。

数据发布日期:2026年2月4日
评测机构:SuperCLUE

火龙果频道