AI-NEWS · 2025年 11月 1日

月之暗面Kimi架构大升级

Moonshot发布Kimi Linear架构:KV缓存减少75%,推理速度提升6倍

核心技术突破

Kimi Linear混合线性注意力架构由Moonshot AI于2025年10月31日发布,这一革命性技术在短程处理、长程处理和强化学习等多个场景中表现优于传统的全注意力方法。

核心创新:Kimi Delta Attention (KDA)

  • 技术基础:基于Gated DeltaNet的优化升级
  • 关键改进:引入更高效的选通机制
  • 核心优势:提升有限状态RNN内存的利用效率

架构设计特点

模块组成

  • 三个Kimi Delta Attention模块
  • 一个全局MLA(多层感知机)

技术优势

  • 通过细粒度选通机制显著压缩有限状态RNN的内存使用
  • 同时提升模型信息处理速度
  • 有效降低内存消耗
  • 具备更强的实用性

性能表现数据

在1M tokens场景下的测试结果

  • KV缓存使用量:减少75%
  • 解码吞吐量:最高提升6倍
  • 训练速度(TPOT):相比传统MLA加速6.3倍

行业意义

随着人工智能的快速发展,提升模型处理能力和效率已成为行业关键挑战。Kimi Linear架构通过创新设计为该领域提供了新的解决方案,有望成为未来行业新标杆。

技术资源

详细技术报告可通过官方GitHub页面获取,建议感兴趣的读者进一步探索其技术细节。

火龙果频道