AI-NEWS · 2025年 7月 8日

腾讯开源思维大模型

腾讯开源混元A13B大模型:动态推理架构,专注思考能力

核心创新:动态推理与MoE架构

  • 动态推理机制:可根据任务复杂度智能切换"思考"模式

    • 简单查询:快速响应模式(最小推理步骤)
    • 复杂问题:深度推理模式(多步思考过程)
    • 支持手动控制指令:
      • think:启用深度模式
      • nothink:禁用深度模式
  • MoE架构设计

    • 总参数量:800亿
    • 实际推理激活参数:130亿(提升效率)
    • 上下文窗口:256K tokens(超长文本处理能力)

训练数据与性能表现

  • 训练规模

    • 基础训练数据:20万亿tokens
    • STEM专项数据:2500亿tokens(数学教材/考试题/GitHub代码/逻辑谜题等)
  • 关键性能指标

    • 2024美国数学邀请赛(AIME):
      • 混元A13B准确率:87.3%
      • OpenAI o1准确率:74.3%(对比基准)
  • 官方定位

    • "Hunyuan-A13B-Instruct"版本性能对标OpenAI、Deepseek、阿里通义千问等领先模型

数据来源:腾讯技术报告(2025年7月发布)

火龙果频道