AI-NEWS · 2025年 7月 27日

快手开源KAT-V1大模型

Kuaishou开源KAT-V1 AutoThink大模型:性能对标行业旗舰,创新解决"过度思考"问题

核心亮点

  • 双版本发布:推出40B和200B两个参数量级版本
    • 40B版本在自动思考模式下性能接近6850亿参数的DeepSeek-R1
    • 200B版本在多项基准测试中超越Qwen、DeepSeek和Llama系列旗舰模型

技术突破

  1. 混合训练范式

    • 创新性结合短思考与长思考模式
    • 采用新型强化学习算法Step-SRPO,显著提升模型推理能力和思考密度
  2. 智能思考调节

    • 自主根据问题复杂度调整思考深度
    • 解决行业普遍存在的"过度思考"问题(响应时间过长)
  3. 数据处理创新

    • 基于Qwen2.5-32B扩展开发
    • 预训练阶段使用约1000万示例数据
    • 覆盖科学、代码、数学等多领域能力

性能表现

  • LiveCodeBench Pro测试

    • 40B版本成功进入闭源模型梯队
    • 超越众多开源模型表现
  • 复杂问题处理

    • 性能达到DeepSeek-R1-0528的95%以上
    • 通过异构蒸馏框架大幅降低模型初始化成本

可用性

  • 40B版本

    • 已上线Hugging Face平台
    • 可通过Kuaishou的AI开发助手Kwaipilot体验
  • 200B版本

    • 当前处于训练阶段(MoE架构)
    • 预计未来将带来更强特性与应用

注:技术细节可参考官方技术报告,模型已完全开源

火龙果频道