AI-NEWS · 2024年 7月 15日

微软MIT开创推理新纪元:6700万参数模型,与GPT-4一较高下

微软与MIT新推理模型概述

研究背景

在智能设备普及的时代,因果推理(如“因为下雨,所以要带伞”)变得尤为重要。微软和麻省理工学院的研究团队开发了一种新的机器学习训练策略,显著提升了模型的逻辑推理能力。

关键成果

  1. 独特训练方法:采用新颖的训练方法,与传统机器学习技术有明显不同。
  2. 逻辑推理改进:显著提升大型模型的逻辑推理能力,解决了之前的挑战。
  3. 因果关系构建训练集:利用因果关系模型构建训练数据,揭示变量间因果联系,使模型能理解背后的因果逻辑。
  4. 基础公理教学:直接传授模型逻辑和数学基础前提,提高其逻辑推理能力。
  5. 小型Transformer模型表现:尽管只有6700万参数,但通过上述方法训练的小型Transformer模型,其推理能力与GPT-4相媲美。

公理训练方法

该方法类似于给AI提供一本“因果关系手册”,通过这本手册教AI识别和应用因果规则。实验表明,这种方法使AI能够在小规模图上学会因果关系,并将这些知识应用到更大未见过的图上。

研究贡献

这项研究提出了一种新方法,使AI能从被动数据中学习因果推理,赋予AI新的“思考”方式,从而更好地理解和解释世界。这不仅展示了AI学习因果推理的可能性,还展望了未来AI的广泛应用场景,如智能助手不仅能回答问题,还能解释原因。

论文地址

查看详细论文

Source:https://www.aibase.com/news/10215