AI-NEWS · 2024年 10月 30日

MIT发现大型模型中的“脑区”!

以下是关于最新研究的分析和总结,该研究表明大型语言模型(LLMs)内部结构与人类大脑惊人相似。

研究概述

来源: 麻省理工学院
技术手段: 使用稀疏自动编码器技术对LLM的激活空间进行深入分析。

结构特征层次

  1. 微观层面

    • 发现类似于“晶体”的结构,这些“晶体”由平行四边形或梯形组成,与单词类比(如“man:woman::king:queen”)相似。
    • 通过线性判别分析去除一些不相关的干扰因素后,“晶体”结构变得更加清晰。
  2. 中观层面

    • 发现LLM的激活空间表现出类似于人类大脑功能区划的模块化结构。
      • 数学和编程相关特征聚集在一起,形成类似大脑“叶”的结构。
      • 通过多项指标的定量分析确认这些“叶”在空间上的局部性,表明共存的功能更加集中。
  3. 宏观层面

    • LLM特征点云的整体结构不是各向同性的,表现出幂律特征值分布,在中间层尤为明显。
    • 定量分析不同层次的聚类熵显示:中间层的聚类熵较低,表示特征表达更为集中;而早期和晚期层的聚类熵较高,表明特征更加分散。

研究结论

  • 这项研究为理解大型语言模型内部机制提供了新视角。
  • 为进一步开发更强大、智能的人工智能系统奠定了基础。

数据分析观点

  1. 数据集中与分散规律

    • 中间层的聚类熵较低,说明特征表示更加集中,有利于提取复杂模式和抽象概念。
    • 较早期和晚期层的高聚类熵表明这些层次更倾向于处理多样化的输入信息。
  2. 大脑功能区划的相似性

    • LLM的模块化结构与人类大脑的功能区划相似,这可能意味着LLM能够以类似于人脑的方式组织知识,为未来的AI系统设计提供了新的思路。

对公司决策的影响

  1. 技术研发方向

    • 公司可以考虑将研究重点放在中间层特征表示上,优化模型性能。
    • 研究大脑功能区划的模拟技术,开发具有更强抽象能力和泛化能力的新一代LLM。
  2. 产品创新

    • 利用这一发现,研发更具智能化和自适应性的AI系统,以满足用户对复杂任务的需求。
    • 推出基于新模型的产品或服务,提升市场竞争力。

希望这份总结能够对公司决策提供有价值的参考。

Source:https://www.aibase.com/news/12859