北京智华华章科技有限公司年度报告:GLM-Zero-Preview模型发布
北京智华华章科技有限公司发布了其首个基于扩展强化学习技术训练的推理模型——GLM-Zero-Preview。该模型专注于提升人工智能的推理能力,特别是在数学逻辑、代码编写及解决需要深度推理的问题方面表现出色。
模型性能对比
与基础模型相比,GLM-Zero-Preview在专家任务上表现显著提升,同时保持了普遍任务的表现水平。在AIME2024、MATH500和LiveCodeBench评估中,其结果可媲美OpenAI的o1-preview模型。
用户体验
用户可以在“零推理模型”代理上免费体验GLM-Zero-Preview(通过智华清言平台),支持文本和图片上传,并输出完整的推理过程。开发者还可通过智华开放平台API访问该模型。

持续优化计划
虽然GLM-Zero-Preview与OpenAI的o3模型相比仍存在一定差距,但公司计划持续优化强化学习技术,并即将推出官方版本GLM-Zero。该模型将扩展深度思考能力从数学逻辑领域延伸至更多通用技术领域。
强化学习在推理中的重要性
随着训练量增加,GLM-Zero-Preview在深度推理方面的性能稳步提升。推理阶段的缩放定律已得到验证:随着处理令牌数量和计算能力的增加,结果质量逐步提高。该模型能够自主做出决策,在推理过程中分解问题并尝试多种方法解决问题,类似于人类的决策过程。
实际案例
GLM-Zero-Preview展示了在逻辑推理中识别逻辑漏洞和模拟各种假设的能力,在数学上具备强大的归纳和演绎能力,迅速处理复杂运算,并在2025年研究生入学考试数学测试中达到了优秀的硕士水平。此外,该模型熟练掌握多种编程语言,帮助开发者快速编写代码。
来源: [智华清言](Zhihua Qingyan), [智华开放平台](Zhihua Open Platform)