AI-NEWS · 2024年 7月 17日

AI大模型数字比较出错引发讨论月之暗面回应9.11大于9.9:有助了解能力边界

近日，多家人工智能大模型在处理简单数字比较任务时出现错误，引发了广泛关注。包括字节豆包、GPT4o、月之暗面Kimi、阶跃星辰跃问、百川智能百小应等知名AI模型，在回答"9.11和9.9哪个更大"时均给出了错误答案。此外，这些模型在回答"strawberry"一词中有几个"r"时也出现了错误。

月之暗面公司对此现象做出回应，表示人类对大模型能力的探索仍处于早期阶段，需要更多研究和测试来了解其能力边界。他们欢迎用户报告更多边界案例，以增进对大模型能力的理解。同时，月之暗面指出，解决这些问题不能仅依赖逐一修复，而是需要增强底层基础模型的智能水平，使其在复杂和极端情况下依然表现出色。

这一事件引发了业界对AI大模型基础能力的讨论，凸显了当前AI技术在处理某些看似简单任务时仍面临挑战。随着研究深入和技术进步，相信这些问题将逐步得到改善。

Source:https://www.aibase.com/news/10277

您可能还喜欢...