国产大模型跻身全球前十！文心ERNIE 5.0登顶LMArena榜单，数学能力逼近GPT

发布日期： 2026年1月15日
来源： AIbase Daily

核心摘要

百度正式发布并上线了文心大模型的最新版本——ERNIE-5.0-0110。该模型在权威评测平台LMArena的最新文本能力排行榜中，以1460分的成绩位列全球第八，成为该榜单前十名中唯一的国产大模型。

在长期被视为国产模型短板的数学推理领域，ERNIE-5.0-0110取得了重大突破，排名跃升至全球第二，仅次于尚未发布的GPT-5.2-High版本。这表明中国AI不仅在通用语言理解上建立了坚实基础，在高级逻辑与符号推理任务上也展现出世界级的竞争力。

LMArena被广泛认为是大型模型的多维度竞技场。其排名综合考量模型在问答、创作、推理、编码等多方面的表现，具有较高的公信力。ERNIE-5.0-0110的入选，标志着国产大模型已从“可用”走向“好用”，并在关键能力上接近甚至超越国际顶尖水平。

此次突破并非偶然。百度持续专注于文心大模型的底层架构与训练方法，在知识增强、逻辑推理、多模态协同等方面不断迭代。数学能力的大幅提升，尤其体现了其在形式化推理与问题分解机制上的显著优化——这些是构建真正智能体的核心能力。

GPT-5.2编程能力胜出：AI编程工具Cursor测试显示，GPT-5.2在构建完整Web浏览器等复杂编程任务中表现出色，在逻辑一致性、任务持久性和工程理解力上显著超越Claude Opus4.5。
DeepSeek推出Engram模块：通过向稀疏大语言模型中植入“条件记忆轴”，旨在解决传统Transformer处理重复知识时计算资源浪费的问题，提升处理重复模式的效率。
Volvo EX60搭载Google Gemini：将成为全球首款量产搭载Google Gemini大语言模型的车型，其“Raven Core”计算平台使车辆能理解意图并主动执行复杂任务。
AI代理成为企业核心：HCLSoftware报告显示，到2026年，85%的企业已开始运营或测试自主AI代理，使其能独立决策和执行任务。超过80%的高管认为AI将推动企业深刻变革。
OpenAI与Cerebras合作：将部署一个750兆瓦的Cerebras晶圆级系统，构建全球最大的AI推理平台。该项目交易价值超过100亿美元，显示出大模型厂商正加速减少对传统GPU的依赖。