NVIDIA GB200 NVL72 性能表现惊人，较 AMD MI355X 提升28倍

核心摘要

根据 SemiAnalysis 发布的 InferenceMAX 基准测试结果，NVIDIA 的 GB200 NVL72 机架系统在运行 Deepseek-R1 0528 混合专家模型时，其推理性能显著超越规模类似的 AMD Instinct MI355X 集群，性能差距高达 28倍。在总拥有成本方面，GB200 NVL72 也展现出巨大优势。

测试背景与模型特点

测试模型：Deepseek-R1 0528，一种混合专家模型。
模型特点：MoE 模型会为每类任务激活最合适的“专家”网络，以提高效率。但在大规模扩展时，节点间的通信延迟和带宽压力可能成为计算瓶颈。

NVIDIA GB200 NVL72 的技术优势

架构优化：采用“极限协同设计”策略，将72个芯片紧密互连。
共享内存：配备高达 30TB 的共享内存，大幅提升了数据传输效率，有效解决了延迟问题。
性能数据：在类似配置下，GB200 NVL72 实现了每 GPU 75 tokens/秒 的吞吐量。

成本效益分析

基于 Oracle 云定价数据的分析显示：

相对成本：GB200 NVL72 的每 token 成本仅为 AMD 解决方案的 十五分之一。
交互率：提供更高的交互率。
总拥有成本：对于大规模云计算公司而言，GB200 NVL72 在拥有强大性能的同时，也展现出卓越的成本效益。

竞争格局与未来展望

AMD 的竞争力：AMD MI355X 凭借其大容量的 HBM3e 内存，在密集模型环境中仍是一个有竞争力的选择。
当前态势：AMD 尚未推出新的机架级解决方案来应对 GB200 NVL72 的挑战。
未来竞争：随着 AMD Helios 平台与 NVIDIA Vera Rubin 平台之间的竞争加剧，机架级扩展解决方案的竞争将更加激烈。

关键要点总结

性能领先：NVIDIA GB200 NVL72 性能是 AMD MI355X 的28倍。
技术突破：通过优化架构和高速共享内存解决了数据传输延迟问题。
成本优势：总拥有成本显著低于竞争对手。
竞争持续：AMD 在密集模型领域仍有优势，未来机架级解决方案的竞争将更趋白热化。

测试来源：SemiAnalysis InferenceMAX 基准测试（由 Signal65 分析）。
信息发布日期：2026年1月4日。

火龙果频道

近期新闻

AI-NEWS · 2026年 1月 5日

英伟达GB200性能领先

NVIDIA GB200 NVL72 性能表现惊人，较 AMD MI355X 提升28倍

核心摘要

测试背景与模型特点

NVIDIA GB200 NVL72 的技术优势

成本效益分析

竞争格局与未来展望

关键要点总结

您可能还喜欢...

AI-NEWS · 2026年 1月 5日

NVIDIA GB200 NVL72 性能表现惊人，较 AMD MI355X 提升28倍

核心摘要

测试背景与模型特点

NVIDIA GB200 NVL72 的技术优势

成本效益分析

竞争格局与未来展望

关键要点总结

您可能还喜欢...

魔方开源，40B模型破界

OpenAI移除AI安全核心承诺

谷歌提出百万专家Mixture 释放进一步扩展 Transformer 的潜力