AI-NEWS · 2025年 7月 13日

Moonshot AI开源Kimi K2模型

Moonshot AI开源Kimi K2模型:1T参数的MoE架构突破

核心参数与性能

  • 模型架构:基于MoE(混合专家)架构
  • 参数量:总参数量1T,激活参数量32B
  • 关键性能
    • 在SWE Bench Verified、Tau2、AceBench等基准测试中位列开源模型榜首
    • 在代码编写、Agent任务执行和数学推理方面表现突出

技术创新

  • 训练优化
    • 采用创新MuonClip优化器
    • 解决大规模训练中注意力logits过大的问题
    • 完成15.5T tokens的稳定训练(全程无loss异常波动)
  • 效率提升:显著提高训练稳定性和token使用效率

核心能力

1. 编程能力

  • 支持生成具有设计感的前端代码(含粒子系统/可视化/3D场景)
  • 可自主构建完整期货交易界面(无需具体指令)

2. Agent工具调用

  • 稳定解析复杂指令
  • 自动分解需求为标准化的ToolCall结构
  • 应用案例:
    • 分析远程办公比例对薪资的影响
    • 制定Coldplay追星计划

3. 风格化写作

  • 支持多风格转换(如科技文→中学生语气)
  • 可模仿苹果广告文案风格
  • 虚构写作注重细节与情感表达

开源版本

版本类型 特点 适用场景
Kimi-K2-Base 未经过指令微调的基础预训练模型 研究/定制场景
Kimi-K2-Instruct 通用指令微调版 QA/Agent任务

开源平台:HuggingFace(含模型及fp8权重文件)

开发者支持

  • 推理引擎支持:vLLM/SGLang/ktransformers
  • API服务
    • 支持128K上下文长度
    • 兼容OpenAI和Anthropic API格式
    • 计费标准:
      • 输入token:4元/百万
      • 输出token:16元/百万

火龙果频道