AI-NEWS · 2025年 8月 3日

深求发布大模型专利

DeepSeek发布大语言模型部署新专利,提升系统性能

专利概述

杭州深度求索人工智能基础技术研究有限公司(DeepSeek关联公司)近日公开了一项名为"大语言模型的部署方法及系统"的专利。这标志着该公司在人工智能领域,特别是大语言模型部署方面取得了重要进展。

核心技术

  • 创新部署方法:将大语言模型的两个关键阶段(预填充阶段和解码阶段)部署在高性能计算和大内存机器上
  • 分布式部署优势
    • 有效平衡工作负载
    • 最大化硬件资源利用率
    • 减少计算能力闲置
    • 降低整体延迟
    • 显著提高系统吞吐量

技术突破

  • 优化资源分配,增强系统对不同工作负载的适应性
  • 提升系统可扩展性和容错性
  • 为未来AI模型提供更高效、智能的部署方案

相关产品

DeepSeek-V3核心产品技术参数:

  • 采用强大的混合专家(MoE)语言模型
  • 总参数量达6710亿
  • 每个token激活370亿参数

行业影响

该技术将推动AI技术的普及应用,支持各行业数字化转型。

关键点总结

  1. 创新大语言模型部署方法,提升系统性能
  2. 分布式部署最大化硬件资源利用率,降低延迟
  3. 增强系统可扩展性和容错性,支持未来AI技术发展

火龙果频道