AI-NEWS · 2025年 9月 3日

清华东大发布UltraRAG 2.0

清华大学与东北大学联合发布UltraRAG 2.0:50行代码实现高性能检索增强生成系统

项目背景

2025年9月2日,清华大学THUNLP实验室、东北大学NEUIR实验室、OpenBMB和AI9Stars联合发布了UltraRAG 2.0。这是首个基于模型上下文协议(MCP)架构设计的检索增强生成(RAG)框架。

核心创新

简化开发流程

  • 代码量大幅减少:传统方法IRCoT需要近900行代码,而UltraRAG 2.0仅需约50行代码即可实现相同功能
  • YAML声明式编程:用户可通过编写YAML文件声明复杂逻辑(串行、循环、条件分支等),显著降低实现门槛
  • 工作流编排:50%的代码用于YAML伪代码的工作流编排

技术特性

  • 支持动态检索、条件判断和多轮交互等高级功能
  • 性能比传统Vanilla RAG提升约12%
  • 特别适用于复杂多跳问题的处理需求

架构优势

MCP架构设计

  • 将RAG核心组件封装为独立的MCP服务器
  • 支持不同模块间的无缝复用
  • 支持模块的灵活扩展和集成
  • 便于研究人员快速适配新模型和算法

开发效率提升

  • 通过简洁的声明式方法构建多阶段推理过程
  • 复杂推理逻辑不再需要冗长的手动编码
  • 大幅提高系统开发效率和可复现性

项目资源

  • GitHub仓库:提供开源代码
  • 项目主页:详细技术文档和使用指南

行业意义

在当前RAG发展趋势中,许多系统已集成自适应知识组织、多轮推理和动态检索等高级功能,但这些复杂特性带来了高昂的工程成本,限制了新想法的快速迭代和复制。UltraRAG 2.0的发布正是为了解决这一问题,让研究人员能够:

  • 节省工程实现的时间和精力
  • 更专注于算法创新和实验设计
  • 快速构建高性能实验平台

该框架的推出标志着RAG系统开发进入了一个更加高效、灵活的新阶段。

火龙果频道