AI-NEWS · 2025年 7月 24日

Kimi K2技术报告发布

Kimi K2技术报告解读:万亿参数模型的技术突破

核心参数与成就

  • 总参数量:1万亿
  • 激活参数量:32亿
  • 竞赛表现:发布一周即获得全球开源模型竞赛冠军
  • 对标模型:性能接近Grok4、GPT4.5等顶级闭源模型

关键技术突破

1. 创新优化器MuonClip

  • 取代传统Adam优化器
  • 特点:
    • 高效token利用率
    • 训练稳定性强
  • 预训练数据处理能力:15.5万亿token(无数据丢失)

2. 数据合成系统

  • 开发大规模Agentic Tool Use数据合成管道
  • 覆盖多领域工具使用场景
  • 提供丰富的训练场景支持

3. 重述训练法(Restatement Method)

  • 核心原理:通过知识的多维度表达提升数据效率
  • 实施方式:
    • 将复杂内容改写为易理解的笔记风格
    • 特别针对数学和知识类文本优化
  • 效果数据:
    • 1轮改写数据训练 > 10轮原始数据训练准确率

训练优化策略

  1. 后训练阶段

    • 监督微调(SFT)
    • 强化学习(RL)
  2. 质量保障机制

    • 可验证的奖励环境
    • 自评估系统
    • 预算控制策略
    • 温度衰减策略

硬件支持

  • 采用NVIDIA H800 GPU集群
  • 特点:
    • 大规模高带宽
    • 保障高效训练与数据传输

行业影响

  • 为开源模型发展注入新活力
  • 引发业内广泛关注

火龙果频道