AI-NEWS · 2026年 1月 16日

文心大模型跻身全球前十

国产大模型跻身全球前十!文心ERNIE 5.0登顶LMArena榜单,数学能力逼近GPT

发布日期: 2026年1月15日
来源: AIbase Daily

核心摘要

百度正式发布并上线了文心大模型的最新版本——ERNIE-5.0-0110。该模型在权威评测平台LMArena的最新文本能力排行榜中,以1460分的成绩位列全球第八,成为该榜单前十名中唯一的国产大模型

关键突破:数学推理能力全球领先

在长期被视为国产模型短板的数学推理领域,ERNIE-5.0-0110取得了重大突破,排名跃升至全球第二,仅次于尚未发布的GPT-5.2-High版本。这表明中国AI不仅在通用语言理解上建立了坚实基础,在高级逻辑与符号推理任务上也展现出世界级的竞争力。

关于LMArena榜单

LMArena被广泛认为是大型模型的多维度竞技场。其排名综合考量模型在问答、创作、推理、编码等多方面的表现,具有较高的公信力。ERNIE-5.0-0110的入选,标志着国产大模型已从“可用”走向“好用”,并在关键能力上接近甚至超越国际顶尖水平。

技术背景与意义

此次突破并非偶然。百度持续专注于文心大模型的底层架构与训练方法,在知识增强、逻辑推理、多模态协同等方面不断迭代。数学能力的大幅提升,尤其体现了其在形式化推理与问题分解机制上的显著优化——这些是构建真正智能体的核心能力。

其他相关AI新闻摘要(同日)

  1. GPT-5.2编程能力胜出:AI编程工具Cursor测试显示,GPT-5.2在构建完整Web浏览器等复杂编程任务中表现出色,在逻辑一致性、任务持久性和工程理解力上显著超越Claude Opus4.5。
  2. DeepSeek推出Engram模块:通过向稀疏大语言模型中植入“条件记忆轴”,旨在解决传统Transformer处理重复知识时计算资源浪费的问题,提升处理重复模式的效率。
  3. Volvo EX60搭载Google Gemini:将成为全球首款量产搭载Google Gemini大语言模型的车型,其“Raven Core”计算平台使车辆能理解意图并主动执行复杂任务。
  4. AI代理成为企业核心:HCLSoftware报告显示,到2026年,85%的企业已开始运营或测试自主AI代理,使其能独立决策和执行任务。超过80%的高管认为AI将推动企业深刻变革。
  5. OpenAI与Cerebras合作:将部署一个750兆瓦的Cerebras晶圆级系统,构建全球最大的AI推理平台。该项目交易价值超过100亿美元,显示出大模型厂商正加速减少对传统GPU的依赖。

火龙果频道