AI-NEWS · 2026年 1月 5日

英伟达GB200性能领先

NVIDIA GB200 NVL72 性能表现惊人,较 AMD MI355X 提升28倍

核心摘要

根据 SemiAnalysis 发布的 InferenceMAX 基准测试结果,NVIDIA 的 GB200 NVL72 机架系统在运行 Deepseek-R1 0528 混合专家模型时,其推理性能显著超越规模类似的 AMD Instinct MI355X 集群,性能差距高达 28倍。在总拥有成本方面,GB200 NVL72 也展现出巨大优势。

测试背景与模型特点

  • 测试模型:Deepseek-R1 0528,一种混合专家模型。
  • 模型特点:MoE 模型会为每类任务激活最合适的“专家”网络,以提高效率。但在大规模扩展时,节点间的通信延迟和带宽压力可能成为计算瓶颈。

NVIDIA GB200 NVL72 的技术优势

  1. 架构优化:采用“极限协同设计”策略,将72个芯片紧密互连。
  2. 共享内存:配备高达 30TB 的共享内存,大幅提升了数据传输效率,有效解决了延迟问题。
  3. 性能数据:在类似配置下,GB200 NVL72 实现了每 GPU 75 tokens/秒 的吞吐量。

成本效益分析

基于 Oracle 云定价数据的分析显示:

  • 相对成本:GB200 NVL72 的每 token 成本仅为 AMD 解决方案的 十五分之一
  • 交互率:提供更高的交互率。
  • 总拥有成本:对于大规模云计算公司而言,GB200 NVL72 在拥有强大性能的同时,也展现出卓越的成本效益。

竞争格局与未来展望

  • AMD 的竞争力:AMD MI355X 凭借其大容量的 HBM3e 内存,在密集模型环境中仍是一个有竞争力的选择。
  • 当前态势:AMD 尚未推出新的机架级解决方案来应对 GB200 NVL72 的挑战。
  • 未来竞争:随着 AMD Helios 平台与 NVIDIA Vera Rubin 平台之间的竞争加剧,机架级扩展解决方案的竞争将更加激烈。

关键要点总结

  1. 性能领先:NVIDIA GB200 NVL72 性能是 AMD MI355X 的28倍。
  2. 技术突破:通过优化架构和高速共享内存解决了数据传输延迟问题。
  3. 成本优势:总拥有成本显著低于竞争对手。
  4. 竞争持续:AMD 在密集模型领域仍有优势,未来机架级解决方案的竞争将更趋白热化。

测试来源:SemiAnalysis InferenceMAX 基准测试(由 Signal65 分析)。
信息发布日期:2026年1月4日。

火龙果频道