AI-NEWS · 2024年 7月 17日

AI大模型数字比较出错引发讨论 月之暗面回应9.11大于9.9:有助了解能力边界

近日,多家人工智能大模型在处理简单数字比较任务时出现错误,引发了广泛关注。包括字节豆包、GPT4o、月之暗面Kimi、阶跃星辰跃问、百川智能百小应等知名AI模型,在回答"9.11和9.9哪个更大"时均给出了错误答案。此外,这些模型在回答"strawberry"一词中有几个"r"时也出现了错误。

月之暗面公司对此现象做出回应,表示人类对大模型能力的探索仍处于早期阶段,需要更多研究和测试来了解其能力边界。他们欢迎用户报告更多边界案例,以增进对大模型能力的理解。同时,月之暗面指出,解决这些问题不能仅依赖逐一修复,而是需要增强底层基础模型的智能水平,使其在复杂和极端情况下依然表现出色。

这一事件引发了业界对AI大模型基础能力的讨论,凸显了当前AI技术在处理某些看似简单任务时仍面临挑战。随着研究深入和技术进步,相信这些问题将逐步得到改善。

Source:https://www.aibase.com/news/10277