AI-NEWS · 2025年 9月 11日

英伟达发布Rubin GPU

英伟达发布Rubin CPX GPU:专为大规模上下文AI应用设计

核心要点

  • 产品定位:Rubin CPX GPU专注于处理超百万tokens的大规模上下文AI工作负载
  • 发布时间:计划2026年底上市
  • 性能亮点:提供8 exaflops AI算力,30 PF NVFP4上下文计算能力
  • 应用场景:复杂软件开发、高清视频生成等长上下文需求场景

技术规格

参数类别 具体配置
计算性能 8 exaflops AI性能,3倍于GB300NVL72系统的指数计算性能
内存配置 128GB GDDR7内存
视频处理 4个编码器+4个解码器
存储能力 100TB快速存储
上下文处理 30 PF NVFP4上下文计算能力

战略布局

  1. AI工厂概念:Vera Rubin NDL144CPX将被纳入大型人工智能工厂体系
  2. 数据中心建设:推出terascale参考设计,与基础设施公司合作重新设计数据中心
  3. 生态合作:涵盖建筑、设计、仿真和运营等全方位解决方案

行业背景

  • 在发布前,英伟达Blackwell GPU刚在MLPerf推理测试中创下新纪录
  • 采用"分解服务"创新技术,提升硬件性能并创造额外收入机会
  • 面临来自Google TPU和OpenAI自研芯片的竞争压力

市场影响

此次发布进一步巩固了英伟达在AI芯片市场的主导地位,特别是在处理长上下文AI应用方面的技术优势。公司通过硬件创新和生态系统建设双管齐下,为未来AI基础设施发展奠定基础。

火龙果频道