AI-NEWS · 2024年 7月 9日

微软开源下一代RAG技术:GraphRAG 利用知识图谱大幅增强语言模型能力

微软推出GraphRAG技术的总结

背景与概述:
微软研究院发布了新一代检索增强生成(RAG)方法——GraphRAG,该方法利用知识图谱显著提升大语言模型(LLM)的问答性能,尤其在处理私有数据集时表现尤为突出。GraphRAG不仅能连接大量信息,还可以处理复杂、跨多个文档的全局性问题。

主要创新点:

  1. 结构化和分层处理: GraphRAG通过构建知识图谱,将文本中的关键信息进行结构化整理,使信息更具系统性。
  2. 改进检索机制: 采用知识图谱而非传统的向量相似性搜索,提高了对复杂信息的处理能力和问答性能。
  3. 多阶段摘要生成: 通过多个阶段的摘要生成和整合,确保回答的全面性和多样性。
  4. 模块化社区检测: 使用社区检测算法将图形索引划分为若干模块化社区,从而并行处理和总结相关信息。

解决的问题:

  1. 局部检索限制: 传统RAG方法只能从局部文本块中直接检索信息,GraphRAG则能覆盖整个文本语料库的全局主题。
  2. 信息丢失: 由于LLM上下文窗口有限,传统方法处理中间信息易丢失。GraphRAG通过知识图谱保留关键信息。
  3. 全局性问题处理: 传统RAG难以生成涉及全局性信息的全面回答,GraphRAG则显著改善了这一问题,能够回答跨多个文档和全局性的问题。

应用场景:

  • 企业专有研究、商业文件或通信等私有数据集的处理:增强了LLM在处理未见过的私有数据集时的推理能力。
  • 大规模文本语料库的整体理解:提高对大型文档或数据集的整体理解能力,支持复杂语义问题的推理。

技术细节:

  • 创建实体知识图: 将文本中的实体(如人、地点、组织)转化为图形索引,每个实体之间的关系通过图结构表示。
  • 图机器学习结合LLM: 利用图机器学习技术,极大增强LLM在处理复杂信息时的性能。
  • 可视化示例: 图示中每个圆圈代表一个实体,大小表示关系数,颜色表示相似实体的分组,提供不同抽象级别上的问题解答。

总结:
GraphRAG通过引入知识图谱、模块化社区检测、多阶段摘要生成等创新方法,显著提升了大语言模型的问答性能,尤其在处理需要全局理解的私有数据集时表现出色。这一技术不仅解决了传统RAG方法的局限,还为大规模文本数据的处理和综合分析提供了新的解决方案。

图示说明:
图示展示了使用GPT-4 Turbo从私有数据集中构建的LLM生成的知识图,每个实体的大小和颜色均表示其关系数和分组情况,有助于理解和回答复杂的全局性问题。

Source:https://xiaohu.ai/p/10982