AI-NEWS · 2025年 1月 10日

GLM-4-9B模型荣登榜首误差仅1.3%

分析报告:GLM-4-9B模型在HHEM-2.1-Open评估系统中的卓越表现

概要

人工智能领域的大型语言模型的“幻觉问题”一直是困扰行业的一大难题。最近,基于HHEM-2.1-Open评估系统的测试显示,来自智汇AI的GLM-4-9B模型取得了显著成果。

测试数据和成绩

在85个被评估的大型语言模型中,GLM-4-9B模型以98.7%的事实一致性率和100%的回答率位居榜首。尤其值得注意的是,该模型的幻觉率为1.3%,不仅排名首位,而且超过了行业巨头OpenAI的GPT系列以及谷歌Gemini系列模型。

技术突破

这一成就标志着中国大型语言模型在降低“幻觉率”方面的重大进展,为提高AI应用的可靠性和准确性带来了新的可能性。这不仅反映了智汇AI在模型开发方面的技术实力,也树立了全球人工智能领域的新标杆。

行业影响

在全球人工智能技术竞争日益激烈的背景下,GLM-4-9B模型的卓越表现无疑将吸引更多关注到智汇AI,并赋予中国AI公司在国际舞台上更大的影响力。

![机器人元宇宙科幻图](Image Source Note: Image generated by AI, image authorized by service provider Midjourney)

版权信息

版权声明:AIbase Base 2024,点击查阅来源

Source:https://www.aibase.com/news/14626