中国电信开源国家级大规模MoE模型TeleChat3
核心摘要
中国电信人工智能研究院(TeleAI)于2026年1月5日正式开源了星语大模型TeleChat3系列。该系列包含国内首个基于全自主算力的大规模参数细粒度MoE模型TeleChat3-105B-A4.7B-Thinking,以及稠密架构模型TeleChat3-36B-Thinking。模型基于15万亿(15T)令牌的基础训练数据,在上海临港全自主算力池完成训练,标志着中国在超大规模AI模型自主可控道路上迈出关键一步。
关键特性
1. 全栈国产化:从芯片到框架的深度兼容
TeleChat3系列与华为昇腾生态深度兼容:
- 硬件:支持昇腾Atlas800T A2训练服务器。
- 软件:基于MindSpore框架开发。
- 基础设施:整个训练和推理过程运行在国产AI计算基础设施上。
- 意义:验证了国产软硬件栈支撑千亿参数大模型的能力,为行业提供了安全、可靠、可替代的技术路径,对保障AI基础设施供应链安全具有战略意义。
2. 创新“思考模式”:使AI推理过程可追溯
该系列引入了“思考(Thought)模式”机制:
- 实现方式:通过在对话模板中添加特定引导符号,模型可自动生成中间推理步骤。
- 效果:显著提升复杂任务中的逻辑性和准确性。
- 性能表现:在知识问答、数学推理、内容创作、代码生成、智能体(Agents)等六大核心维度,性能可比肩国际顶尖模型。
- 示例:在解决数学问题时,模型不仅输出答案,还会展示完整的思维链(“理解题意→分解步骤→应用公式→验证结果”),极大增强了可信度和可调试性。
开源与生态
目前,TeleChat3系列的模型权重、推理代码和使用示例已同步至GitHub和ModelScope平台,支持学术研究和商业应用。中国电信表示,将持续推动模型在政务、通信、能源、金融等重点领域的落地,助力“人工智能+”行动深入产业核心。
行业观察:国产大模型进入“全栈自研+能力对标”新阶段
TeleChat3的发布不仅是一次技术成果展示,更是中国AI产业自立战略的实质性落地。当千亿参数MoE模型能在纯国产算力上高效训练,且“思考模式”逼近国际先进水平时,国产大模型正从“可用”走向“好用”乃至“可信赖用”。
在全球AI竞争日益“地缘政治化”的背景下,中国电信正以TeleAI为支点,构建安全、开放、高性能的国产AI技术栈。这条路径的成败,或将决定中国在未来智能时代的话语权。
项目地址:可通过GitHub及ModelScope平台获取。
