AI-NEWS · 2026年 1月 24日

vLLM团队推Inferact争AI推理王座

价值8亿美元的算力“核弹”诞生:原vLLM团队创立Inferact,剑指全球AI推理王座

核心摘要

2026年1月23日,全球领先的开源推理引擎vLLM的原班团队正式宣布成立AI基础设施公司Inferact,旨在为AI推理领域建立新秩序。该公司在种子轮融资中获得了1.5亿美元的巨额投资,投前估值高达约8亿美元,标志着资本市场对高效AI推理基础设施的强烈信心。

关键细节

1. 融资与估值

  • 融资金额:1.5亿美元(种子轮)
  • 投前估值:约8亿美元
  • 领投方:Andreessen Horowitz (a16z)、Spark Capital
  • 其他投资方:红杉资本、Altimeter Capital、Rho Capital、真格基金等全球顶级机构。

2. 技术背景与目标

  • 团队基础:Inferact由创造并维护开源推理引擎vLLM的核心团队创立。
  • vLLM成就:作为开源社区的宠儿,vLLM已支持超过500种模型架构,并在200多种硬件加速器上稳定运行,承担了全球规模的推理任务。
  • Inferact愿景:将vLLM推向全球领先地位,彻底打破高昂推理成本的束缚,以极致速度让AI智慧流入每一个计算节点。

3. 行业意义

  • 范式转变:Inferact的出现标志着AI行业的焦点正从昂贵的模型训练转向高效的部署与推理阶段。
  • 核心挑战:随着大模型全面部署,推理阶段的算力消耗呈滚雪球式增长,已成为决定商业成败的关键因素。
  • 竞争阶段:这表明AI基础设施的竞争已进入“下半场”,核心在于实现效率最大化。

深度分析

数据透视

  1. 估值与融资规模:种子轮8亿美元的估值和1.5亿美元的融资额极为罕见,反映出投资者认为AI推理效率是当前最紧迫且价值巨大的赛道。
  2. 技术普及度:vLLM支持500+模型和200+硬件的成绩,证明了其技术已成为事实上的行业标准之一,为Inferact的商业化奠定了坚实的用户基础。
  3. 行业趋势:从近期Meta宣布投入巨资自建AI计算与能源设施(Meta Compute计划)、谷歌投资400亿美元在德州建设AI数据中心等事件可以看出,全球科技巨头正在AI基础设施领域进行军备竞赛。Inferact的定位正是这场竞赛中的关键“效率引擎”。

观点

  • 从“造模型”到“用模型”:Inferact的诞生是AI发展进入深水区的标志。行业正从追求参数规模的“军备竞赛”,转向关注如何低成本、高效率地让模型产生实际价值。
  • 开源技术的商业潜力:vLLM的成功商业化路径验证了顶尖开源项目在获得资本加持后,有望成长为基础设施领域的巨头,并推动整个行业的技术进步与成本下降。
  • 推理成本成为新战场:降低推理成本将成为未来几年AI公司核心的竞争力之一。Inferact的目标直击这一痛点,有望重塑AI服务的经济模型。

相关背景(近期行业动态)

  • vLLM-Omni发布(2025年12月):vLLM团队开源了首个“全模态”推理框架,可统一处理文本、图像、音频和视频的生成。
  • 巨头加码基础设施:Meta、谷歌等公司近期均宣布了千亿级别的基础设施投资计划,以保障AI算力与能源供给。
  • 竞争出现:例如xLLM社区等开源项目也在致力于推出更低延迟的推理引擎,表明该领域的技术创新和竞争正在加剧。

本文信息整理自AIbase于2026年1月23日的报道。

火龙果频道