中国移动发布"九天"基础大模型3.0:AI产业化迈出坚实步伐
核心发布
- 发布时间:2025年7月26日
- 发布平台:2025世界人工智能大会"AI革新·产业协同"企业人工智能产业发展论坛
- 发布主体:中国移动自主研发
- 战略地位:国资委战略性新兴产业"百项工程"重要成果
三大核心升级
1. 九天知青语言大模型:架构与性能双突破
-
架构创新:采用MoE架构,支持万亿级参数扩展
-
训练数据:15T tokens多阶段比例预训练数据
-
能力提升:
- 构建113领域×53能力二维分层后训练框架
- 复杂推理能力提升35%
- 专业场景实现零幻觉生成
-
评测表现:
评测名称 得分 全球排名 超越模型 GPQA-Diamond 77.67 第二 DeepSeekR1、Qwen3 ArenaHard V1.0 67.2 第一 – BFCL V3 68 – – -
衍生模型:
- 代码大模型:支持10+编程语言,在EvalPlus等评测表现优异
- 数学大模型:长短思维双模式达SOTA水平,超越Qwen2.5Math等同类模型
2. 九天善智多模态大模型:生成可控性与理解力全面提升
-
技术创新:
- 复杂时空建模
- 流匹配图像视频渐进联合训练
- 端到端局部可控注意力机制
-
能力表现:
- 图像理解:
- MMStar:82.2
- HallusionBench:64.3
- OCRBench:94.9
- 视频理解:在Videomme和MVbench任务领先,超越Qwen2-VL等
- 图像理解:
3. 开源生态建设
-
开源内容:
- 结构化数据大模型(JT-DA-8B系列)
- 数学大模型(JT-Math-8B系列)
- 代码大模型(JT-Coder-8B系列)
- TReB评估系统及结构化数据评估数据集(行业首创)
- CCR-Bench工业场景复杂指令跟随评估数据集(174条高难度数据)
-
开源平台:Github、HuggingFace、Moba社区、Gitee、Arxiv
产业意义
此次发布标志着中国移动在大模型领域实现:
- 安全可控的国产化突破
- 全产业链覆盖能力
- 开源生态建设引领