清华大学与东北大学联合发布UltraRAG 2.0:50行代码实现高性能检索增强生成系统
项目背景
2025年9月2日,清华大学THUNLP实验室、东北大学NEUIR实验室、OpenBMB和AI9Stars联合发布了UltraRAG 2.0。这是首个基于模型上下文协议(MCP)架构设计的检索增强生成(RAG)框架。
核心创新
简化开发流程
- 代码量大幅减少:传统方法IRCoT需要近900行代码,而UltraRAG 2.0仅需约50行代码即可实现相同功能
- YAML声明式编程:用户可通过编写YAML文件声明复杂逻辑(串行、循环、条件分支等),显著降低实现门槛
- 工作流编排:50%的代码用于YAML伪代码的工作流编排
技术特性
- 支持动态检索、条件判断和多轮交互等高级功能
- 性能比传统Vanilla RAG提升约12%
- 特别适用于复杂多跳问题的处理需求
架构优势
MCP架构设计
- 将RAG核心组件封装为独立的MCP服务器
- 支持不同模块间的无缝复用
- 支持模块的灵活扩展和集成
- 便于研究人员快速适配新模型和算法
开发效率提升
- 通过简洁的声明式方法构建多阶段推理过程
- 复杂推理逻辑不再需要冗长的手动编码
- 大幅提高系统开发效率和可复现性
项目资源
- GitHub仓库:提供开源代码
- 项目主页:详细技术文档和使用指南
行业意义
在当前RAG发展趋势中,许多系统已集成自适应知识组织、多轮推理和动态检索等高级功能,但这些复杂特性带来了高昂的工程成本,限制了新想法的快速迭代和复制。UltraRAG 2.0的发布正是为了解决这一问题,让研究人员能够:
- 节省工程实现的时间和精力
- 更专注于算法创新和实验设计
- 快速构建高性能实验平台
该框架的推出标志着RAG系统开发进入了一个更加高效、灵活的新阶段。