AI-NEWS · 2026年 1月 6日

中国电信开源大模型TeleChat3

中国电信开源国家级大规模MoE模型TeleChat3

核心摘要

中国电信人工智能研究院(TeleAI)于2026年1月5日正式开源了星语大模型TeleChat3系列。该系列包含国内首个基于全自主算力的大规模参数细粒度MoE模型TeleChat3-105B-A4.7B-Thinking,以及稠密架构模型TeleChat3-36B-Thinking。模型基于15万亿(15T)令牌的基础训练数据,在上海临港全自主算力池完成训练,标志着中国在超大规模AI模型自主可控道路上迈出关键一步。

关键特性

1. 全栈国产化:从芯片到框架的深度兼容

TeleChat3系列与华为昇腾生态深度兼容:

  • 硬件:支持昇腾Atlas800T A2训练服务器。
  • 软件:基于MindSpore框架开发。
  • 基础设施:整个训练和推理过程运行在国产AI计算基础设施上。
  • 意义:验证了国产软硬件栈支撑千亿参数大模型的能力,为行业提供了安全、可靠、可替代的技术路径,对保障AI基础设施供应链安全具有战略意义。

2. 创新“思考模式”:使AI推理过程可追溯

该系列引入了“思考(Thought)模式”机制:

  • 实现方式:通过在对话模板中添加特定引导符号,模型可自动生成中间推理步骤。
  • 效果:显著提升复杂任务中的逻辑性和准确性。
  • 性能表现:在知识问答、数学推理、内容创作、代码生成、智能体(Agents)等六大核心维度,性能可比肩国际顶尖模型。
  • 示例:在解决数学问题时,模型不仅输出答案,还会展示完整的思维链(“理解题意→分解步骤→应用公式→验证结果”),极大增强了可信度和可调试性。

开源与生态

目前,TeleChat3系列的模型权重、推理代码和使用示例已同步至GitHub和ModelScope平台,支持学术研究和商业应用。中国电信表示,将持续推动模型在政务、通信、能源、金融等重点领域的落地,助力“人工智能+”行动深入产业核心。

行业观察:国产大模型进入“全栈自研+能力对标”新阶段

TeleChat3的发布不仅是一次技术成果展示,更是中国AI产业自立战略的实质性落地。当千亿参数MoE模型能在纯国产算力上高效训练,且“思考模式”逼近国际先进水平时,国产大模型正从“可用”走向“好用”乃至“可信赖用”。

在全球AI竞争日益“地缘政治化”的背景下,中国电信正以TeleAI为支点,构建安全、开放、高性能的国产AI技术栈。这条路径的成败,或将决定中国在未来智能时代的话语权。

项目地址:可通过GitHub及ModelScope平台获取。

火龙果频道