AI-NEWS · 2025年 9月 30日

京东推国产芯片大模型

京东开源基于国产芯片的xLLM推理引擎

核心要点

京东于2025年9月29日宣布开源自主研发的xLLM推理引擎,该引擎基于国产芯片开发,旨在帮助企业以更高性能和更低成本部署人工智能应用,推动行业智能化转型。

技术特性

核心架构

  • 动态调度器:基于请求优先级的动态调度机制,可根据不同请求的重要性智能分配计算资源
  • 自适应架构:动态自适应PD分离架构,可根据实时负载调整处理实例比例
  • 多模态适配:专门针对多模态场景优化,配备EPD混合分离调度器

性能优化

  • 多级流水线执行引擎:基于硬件特性的多级流水线执行引擎
  • 计算优化套件:包含图融合、推测推理和动态负载均衡
  • 缓存管理系统:使用Mooncake构建多级KV缓存全局管理系统

应用成效

实际应用场景

  • 京东AI助手
  • 智能客服系统
  • 风险控制系统
  • 供应链助手

性能提升数据

  • 效率提升:超过5倍
  • 成本降低:机器成本下降90%

未来发展

京东零售AI基础设施团队表示,开源只是第一步,未来将:

  • 根据社区需求持续开放更多高级功能
  • 与清华大学、北京大学、中国科学技术大学等研究机构和产业伙伴合作
  • 共同推动国产AI基础设施技术的创新与发展

行业意义

xLLM的开源将为开发者提供体验强大推理引擎的机会,助力中国AI技术生态系统的建设和发展。

火龙果频道