腾讯开源混元A13B大模型:动态推理架构,专注思考能力
核心创新:动态推理与MoE架构
-
动态推理机制:可根据任务复杂度智能切换"思考"模式
- 简单查询:快速响应模式(最小推理步骤)
- 复杂问题:深度推理模式(多步思考过程)
- 支持手动控制指令:
think
:启用深度模式nothink
:禁用深度模式
-
MoE架构设计:
- 总参数量:800亿
- 实际推理激活参数:130亿(提升效率)
- 上下文窗口:256K tokens(超长文本处理能力)
训练数据与性能表现
-
训练规模:
- 基础训练数据:20万亿tokens
- STEM专项数据:2500亿tokens(数学教材/考试题/GitHub代码/逻辑谜题等)
-
关键性能指标:
- 2024美国数学邀请赛(AIME):
- 混元A13B准确率:87.3%
- OpenAI o1准确率:74.3%(对比基准)
- 2024美国数学邀请赛(AIME):
-
官方定位:
- "Hunyuan-A13B-Instruct"版本性能对标OpenAI、Deepseek、阿里通义千问等领先模型
数据来源:腾讯技术报告(2025年7月发布)