跳至内容
OpenAI与Cerebras合作构建全球最大AI推理平台,挑战英伟达主导地位
核心合作概述
- 合作方:OpenAI与美国AI芯片独角兽Cerebras。
- 合作内容:共同部署总计750兆瓦的Cerebras晶圆级系统,构建全球最大的高速AI推理平台。
- 时间规划:合作将于2026年开始分阶段实施,预计2028年全面投入运营。
- 交易规模:交易价值超过100亿美元(约合697亿元人民币)。
技术细节与性能优势
- 芯片规格:Cerebras芯片被称为“巨芯”,每块芯片集成4万亿个晶体管,面积相当于数百个传统GPU。
- 核心优势:将计算、内存和带宽集成在单个晶圆级硅芯片上,彻底规避了多芯片互连带来的延迟和能耗瓶颈。
- 性能表现:根据OpenAI计算,在运行大模型时,Cerebras系统的响应速度可达基于GPU解决方案的15倍。这对于追求毫秒级交互体验的AI应用而言,不仅是性能提升,更是体验的质变。
合作背景与战略意图
- 历史渊源:OpenAI CEO Sam Altman是Cerebras的早期个人投资者。双方关系可追溯至2017年,即OpenAI成立之初。
- 战略动机:法庭文件显示,OpenAI长期寻求比英伟达更高效、更具成本效益的替代方案。过去一年,OpenAI已与博通联合开发定制芯片,并采购AMD的新款MI450加速器。此次与Cerebras合作,进一步彰显其构建多元化计算基础设施基础的决心。
- 谈判过程:双方于2023年秋季开始正式谈判,并在感恩节前敲定合作意向。驱动力源于对“极速计算”的前所未有的需求。
行业影响与市场动态
- 计算力与收入关联:OpenAI基础设施总监Sachin Katti指出:“计算力直接决定我们的收入潜力。过去两年,计算力每年翻倍,收入增长也随之上升。”工程师反馈显示,现有硬件在高负载任务(如编程辅助)上仍力不从心,促使公司加速引入Cerebras解决方案。
- Cerebras估值飙升:据《华尔街日报》报道,Cerebras正以220亿美元的估值谈判筹集10亿美元,这几乎是此前81亿美元估值的近三倍。该公司在2024年曾提交IPO申请后撤回,目前拥有OpenAI、Meta、IBM、阿布扎比G42等大客户,商业化路径已清晰。截至目前,Cerebras已累计融资18亿美元(不含本轮新资金)。
- 行业转型信号:此次合作不仅关乎两家公司的命运,更折射出AI基础设施的深刻变革——当大模型进入大规模商业化阶段,推理效率已成为用户体验和商业变现的核心杠杆。尽管英伟达仍主导生态,但晶圆级集成、定制ASIC等异构方案正受到顶级玩家的重注。未来的AI竞争可能不再是模型参数的比拼,而是“谁能在一句话问出的瞬间给出答案”。
其他AI领域动态摘要(2026年1月15日)
- GPT-5.2在AI浏览器创建挑战中胜出:在Cursor的测试中,GPT-5.2在构建完整Web浏览器等复杂编程任务上表现优异,逻辑一致性、任务持久性和工程理解力显著超越Claude Opus4.5。
- 百度文心ERNIE-5.0-0110发布:该模型在LMArena全球文本能力排名中位列第八,是唯一进入前十的国产模型。其数学推理能力尤为突出,排名全球第二,仅次于未发布的GPT-5.2-High。
- 通义千问App完成AI支付闭环:集成淘宝闪购和支付宝AI支付,用户可通过自然对话完成商品推荐、下单与支付,实现“说一句话即送达”,标志着AI智能体从“能回答”到“能实际办事”的关键进展。
- 巴菲特警告AI威胁:将人工智能与核武器相提并论,担忧其发展的不确定性,指出即使AI领域的领导者也无法预测该技术的终点。
- AI代理渗透企业核心运营:HCLSoftware报告显示,到2026年,85%的企业已开始运营或测试自主AI代理,使其能独立决策和执行任务。超过80%的高管认为AI将推动企业深刻转型。
火龙果频道