初创公司Positron发布Asimov架构,宣称能效比达英伟达Rubin架构5倍
核心摘要
在2026年2月5日,初创芯片公司Positron正式发布了其专为大型模型推理设计的新型AI芯片——Asimov。该公司宣称,该芯片在能效(每瓦特产生的token数)和成本效益(每美元产生的token数)上,有望达到英伟达下一代Rubin架构的五倍。这一大胆声明引发了业界的广泛关注。
技术细节与创新点
1. 架构“减法”逻辑
Positron的核心创新在于对传统GPU架构进行“减法”重构:
- 摒弃冗余设计:Asimov芯片摒弃了传统计算卡中复杂的控制电路。
- 专注张量处理:采用更纯粹的张量处理架构,旨在最小化非计算阶段的能量损耗。
- 双重效益:此设计不仅降低了运行同规模模型时的功耗,也显著减少了芯片的制造和封装成本。
2. 针对大模型推理的深度优化
- 目标明确:硬件设计针对当前主流的Transformer架构进行了深度优化。
- 解决痛点:旨在解决部署万亿参数模型时面临的功耗瓶颈和高昂运营成本问题。
市场挑战与前景
面临的挑战
尽管理论数据亮眼,但挑战英伟达的市场地位并非易事。Positron目前正致力于:
- 构建配套的编译器和开发生态系统。
- 确保开发者能够将现有的PyTorch或TensorFlow模型无缝迁移至Asimov平台。
行业意义
分析认为,Positron的入局代表了AI芯片领域从“通用算力”向“专用推理”转型的趋势。如果Asimov能兑现其五倍性能的承诺,或将彻底重塑大模型推理市场的成本格局。
关键要点总结
- 能效挑战:Asimov芯片宣称其每瓦特/每美元的token效率是英伟达未来Rubin架构的五倍,聚焦极致性价比。
- 架构创新:通过舍弃通用计算的冗余设计,采用专注于张量计算的专用架构,显著降低推理过程中的能量损耗和硬件成本。
- 目标市场:针对大规模模型推理场景,旨在破解万亿参数模型部署的功率与成本瓶颈。
注:本文信息整理自2026年2月5日的公开报道。
