GLM 4.6发布:国产芯片联合推动AI发展
核心要点
智谱公司于2025年9月30日正式发布GLM系列最新版本——GLM-4.6,标志着国产芯片技术在AI领域取得重要突破。
技术突破
- 芯片创新:采用寒武纪先进国产芯片,首次实现FP8+Int4混合量化部署
- 性能优势:在保持模型精度的同时,显著降低推理成本
- 本地运行:为大模型在国产芯片上的本地化运行开辟新路径
技术生态
- 推理框架:与寒武纪、摩尔线程联合,在vLLM推理框架下展现强劲性能
- 架构验证:MUSA架构展现出良好的生态兼容性和快速响应能力
- 精度支持:摩尔线程新一代GPU稳定运行原生FP8精度
服务升级
- 平台部署:通过MaaS平台向个人和企业用户正式开放服务
- 功能增强:提升图像识别和搜索能力
- 编程支持:兼容Claude Code、Roo Code、Kilo Code等主流编程工具
商业模式
- 开发者套餐:GLM Coding Max套餐为高频开发者提供更多使用空间,月费低至20元
- 自动升级:现有GLM Coding Plan订阅用户将自动升级至GLM-4.6
- 企业方案:针对需要安全性、成本效益和顶级国际性能的企业推出专属套餐
发展前景
国产GLM大模型将与国产芯片深度协同,在模型训练和推理过程中优化性能效率。随着技术成熟,国产大模型将在更多应用场景中展现其能力。
行业意义
此次发布不仅展示了智谱在AI领域的技术实力,更为国产芯片发展注入新动力,体现了中国在AI领域自主创新能力的持续提升。