GLM-4-9B模型荣登榜首误差仅1.3%

分析报告：GLM-4-9B模型在HHEM-2.1-Open评估系统中的卓越表现

人工智能领域的大型语言模型的“幻觉问题”一直是困扰行业的一大难题。最近，基于HHEM-2.1-Open评估系统的测试显示，来自智汇AI的GLM-4-9B模型取得了显著成果。

在85个被评估的大型语言模型中，GLM-4-9B模型以98.7%的事实一致性率和100%的回答率位居榜首。尤其值得注意的是，该模型的幻觉率为1.3%，不仅排名首位，而且超过了行业巨头OpenAI的GPT系列以及谷歌Gemini系列模型。

这一成就标志着中国大型语言模型在降低“幻觉率”方面的重大进展，为提高AI应用的可靠性和准确性带来了新的可能性。这不仅反映了智汇AI在模型开发方面的技术实力，也树立了全球人工智能领域的新标杆。

在全球人工智能技术竞争日益激烈的背景下，GLM-4-9B模型的卓越表现无疑将吸引更多关注到智汇AI，并赋予中国AI公司在国际舞台上更大的影响力。

![机器人元宇宙科幻图](Image Source Note: Image generated by AI, image authorized by service provider Midjourney)