GLM-5大模型正式支持七大国产芯片平台,编程能力大幅跃升
核心摘要
在近期春节假期,国产AI大模型迎来发布潮,其中智谱AI的GLM-5模型备受关注。该模型不仅实现了重大技术突破,还首次全面支持七大国产芯片平台,展现了我国AI产业的强劲实力。
关键数据与性能表现
- 参数量:达到7440亿,几乎是前代GLM-4.X的两倍。
- 编程能力排名:
- 智能体(Agent)编程能力全球第一。
- 整体编程能力全球第三,超越众多国际竞争对手。
- 成本优化:在长序列处理任务上,部署成本降低了50%。
四大关键技术创新
GLM-5的性能提升主要得益于以下四项关键技术创新:
- 引入DSA稀疏注意力机制:采用新的稀疏注意力机制,根据token重要性动态分配资源,显著降低了训练和推理成本。
- 构建异步强化学习基础设施:新的基础设施实现了生成与训练的深度解耦,大幅提升了GPU利用率,加速了智能体的轨迹探索,解决了以往的同步瓶颈。
- 新型异步智能体强化学习算法:该算法优化了模型的自主决策质量,使其能在动态环境中自我修正并持续学习,从而在实际编程场景中表现出色。
- 全面兼容国产算力生态:GLM-5已全面兼容包括华为昇腾、寒武纪、海光等在内的七大国产芯片平台。智谱宣称,GLM-5在单国产算力节点上的性能已接近国际主流GPU计算集群。
市场影响与后续动态
- 算力需求激增:由于GLM-5的巨大热度,用户需求激增导致算力资源一度紧张,智谱AI已为此发布致歉信并提出补偿措施以改善用户体验。
- 发布详细技术报告:为帮助用户更好地理解新模型,智谱AI同步发布了详细的技术报告。
- 开启国产大模型涨价先河:值得注意的是,GLM-5在走向海外市场时已率先提价,其海外API价格涨幅最高达一倍,这标志着国产大模型商业化逻辑的转变。
总结
GLM-5的正式发布,凭借其世界级的编程能力、对国产芯片生态的全面支持以及多项底层技术创新,显著提升了国产大模型的竞争力,未来发展前景广阔。
