AI-NEWS · 2026年 1月 16日

文心大模型数学能力全球第二

百度文心大模型ERNIE-5.0-0110正式发布,数学能力位列全球第二

核心发布信息

  • 发布日期:2026年1月15日
  • 发布方:百度
  • 模型名称:文心大模型ERNIE-5.0-0110(下一代ERNIE大模型)
  • 当前状态:已正式发布并投入运营

关键性能与排名

  1. 综合文本能力(LMArena全球排名)

    • 得分:1460分
    • 全球排名:第8位
    • 意义:是唯一进入该榜单全球前十的中国国产大模型
  2. 专项数学能力(全球排名)

    • 排名:全球第二
    • 对比:仅次于尚未发布的GPT-5.2-High模型。

能力提升亮点

除了顶尖的数学处理能力,ERNIE-5.0-0110在以下方面也实现了显著增强:

  • 编程开发
  • 专家知识储备
  • 创意写作
  • 复杂指令执行准确度

专业领域表现

模型在多个职业领域展现出高水平的专业专长,在每个领域均位列前十,包括:

  • 科学研究
  • 商业金融
  • 医疗健康

公众体验

百度已开放公众体验地址,用户可直接登录体验该国产顶级大模型带来的效率提升。


同日其他AI要闻摘要

  1. DeepSeek发布Engram模块:在稀疏大语言模型中引入“条件记忆轴”,旨在解决传统Transformer处理重复知识时浪费计算资源的问题,作为混合专家模型的补充,提升了处理重复模式的效率。
  2. 通义千问(Qwen)全面融入阿里生态
  3. 印度AI模型Alpie表现亮眼:在GSM8K数学和SW工程基准测试中表现出色,以320亿参数超越GPT-4o,被称为印度版“DeepSeek”。
  4. 开源语音推理模型Step-Audio-R1.1登顶全球榜单:以96.4%的准确率超越多个主流闭源模型,创下历史新纪录。
  5. X平台紧急收紧Grok图像功能:完全禁止编辑真人照片,并对生成露骨内容进行严格管控,以回应该功能涉及“儿童色情”图像的指控。
  6. 苹果发布多模态模型Manzano:通过创新的双结构架构,解决了AI领域长期无法平衡视觉理解与图像生成的问题。
  7. 韩国推进“主权AI”遇尴尬:其国内大模型被曝深度参考中美开源代码,引发对真正“本土”技术发展的质疑。
  8. PixVerse R1实时世界模型发布:爱诗科技发布全球首个通用实时世界模型PixVerse R1,支持高达1080P的视频质量。

本文信息整理自AIbase Daily 2026年1月15日的报道。

火龙果频道