AI-NEWS · 2026年 2月 6日

正子发布阿西莫夫架构

初创公司Positron发布Asimov架构,宣称能效比达英伟达Rubin架构5倍

核心摘要

在2026年2月5日,初创芯片公司Positron正式发布了其专为大型模型推理设计的新型AI芯片——Asimov。该公司宣称,该芯片在能效(每瓦特产生的token数)和成本效益(每美元产生的token数)上,有望达到英伟达下一代Rubin架构的五倍。这一大胆声明引发了业界的广泛关注。

技术细节与创新点

1. 架构“减法”逻辑

Positron的核心创新在于对传统GPU架构进行“减法”重构:

  • 摒弃冗余设计:Asimov芯片摒弃了传统计算卡中复杂的控制电路。
  • 专注张量处理:采用更纯粹的张量处理架构,旨在最小化非计算阶段的能量损耗。
  • 双重效益:此设计不仅降低了运行同规模模型时的功耗,也显著减少了芯片的制造和封装成本。

2. 针对大模型推理的深度优化

  • 目标明确:硬件设计针对当前主流的Transformer架构进行了深度优化。
  • 解决痛点:旨在解决部署万亿参数模型时面临的功耗瓶颈和高昂运营成本问题。

市场挑战与前景

面临的挑战

尽管理论数据亮眼,但挑战英伟达的市场地位并非易事。Positron目前正致力于:

  • 构建配套的编译器和开发生态系统。
  • 确保开发者能够将现有的PyTorch或TensorFlow模型无缝迁移至Asimov平台。

行业意义

分析认为,Positron的入局代表了AI芯片领域从“通用算力”向“专用推理”转型的趋势。如果Asimov能兑现其五倍性能的承诺,或将彻底重塑大模型推理市场的成本格局。

关键要点总结

  1. 能效挑战:Asimov芯片宣称其每瓦特/每美元的token效率是英伟达未来Rubin架构的五倍,聚焦极致性价比。
  2. 架构创新:通过舍弃通用计算的冗余设计,采用专注于张量计算的专用架构,显著降低推理过程中的能量损耗和硬件成本。
  3. 目标市场:针对大规模模型推理场景,旨在破解万亿参数模型部署的功率与成本瓶颈。

注:本文信息整理自2026年2月5日的公开报道。

火龙果频道