保姆级教程！清华开源首个MCP RAG框架，手把手带你从安装到跑通，体验什么叫“秀”！

逛 GitHub 挖到宝了，这个叫 UltraRAG 的开源项目是首个基于 MCP 的检索增强生成（RAG）框架，不写代码也能玩转。用 YAML 文件轻松构建复杂 RAG 系统。RAG 系统：简单来说，就是让 AI 模型能先检索相关信息，再生成答案，从而提高准确性。

Python_金钱豹

1338人浏览 · 2025-11-20 13:39:21

Python_金钱豹 · 2025-11-20 13:39:21 发布

逛 GitHub 挖到宝了，这个叫 UltraRAG 的开源项目是首个基于 MCP 的检索增强生成（RAG）框架，不写代码也能玩转。
用 YAML 文件轻松构建复杂 RAG 系统。
RAG 系统：简单来说，就是让 AI 模型能先检索相关信息，再生成答案，从而提高准确性。

UltraRAG 是由清华 THUNLP、东北大学 NEUIR、OpenBMB 等多方联合推出的开源项目。

它能让你更容易构建和测试复杂的 RAG 系统。

01 开源项目简介

这个开源项目的核心思路是把 RAG 的核心组件封装为标准化的独立 MCP Server，提供函数级 Tool 接口支持灵活调用，借助 MCP 客户端建立简洁的链路搭建。

这种设计让想使用 RAG 系统的人只需编写 YAML 配置文件，就能直接声明复杂逻辑，大大降低了技术门槛。

新版版本升级，最新的 2.1 版本主要围绕以下三大核心方向进行了全面升级：

① 原生多模态

统一框架支持文本、图像的检索与生成，新增 VisRAG Pipeline 实现 PDF 到多模态问答的闭环。

而且内置的多模态 Benchmark 覆盖视觉问答等任务，并提供统一的评估体系，方便研究者快速对比实验效果。

② 知识接入与语料构建自动化

支持多格式文档，比如 Word、电子书、网页存档的自动解析与分块，不需要编写复杂脚本即可构建统一格式的知识库。

而且在 PDF 解析方面，它集成了 MinerU 工具，能高保真还原复杂版面与多栏结构，并支持将 PDF 按页转换为图像，保留视觉布局信息。

③ 统一工作流

通过 YAML 配置驱动检索、生成、评估全流程，支持多种引擎与可视化分析，提升实验复现效率。

开源项目链接和相关教程如下：

代码仓库：https://github.com/OpenBMB/UltraRAG
教程文档：https://ultrarag.openbmb.cn/
数据集：https://modelscope.cn/datasets/UltraRAG/UltraRAG_Benchmark

02 实际效果

先来看看效果，基于这个开源项目搭建的 RAG 系统的真实示例。

比如第一个 Case：基于论文《Attention is All You Need》咨询一个问题，论文中的表 4 具体说了什么，帮忙解释一下。

AI 可以直接解析表格内容，给出如下回答，还是挺清晰的。

这是因为刚刚升级的 2.0 可以统一处理文本和图像数据。

上传的 PDF 文档，它不仅能读取文字，还能分析里面的图表和公式，实现真正的多模态检索和生成。

这避免了以前需要切换不同工具的麻烦。

第二个 Case：基于麦肯锡的《生成式人工智能的经济潜力》报告。

让 AI 基于里面的内容，输出生成式 AI 最有潜力的企业职能有哪些？请结合图表和正文说明它们在组织生产力中的影响。

03 如何使用

UltraRAG 支持两种部署方式，第一种是使用 Conda 创建虚拟环境：

另外一种部署方式是通过 Docker：

接下来就能可以基于 UltraRAG 运行一个完整的 RAG Pipeline 了。使用流程主要包括以下三个阶段：

编写 Pipeline 配置文件
编译 Pipeline 并调整参数
运行 Pipeline

这里不详细展开，可以直接看下面这个文档，写的很详细。

https://ultrarag.openbmb.cn/pages/cn/getting_started/quick_start

你不需要写代码，配置一个 YMAL 文件就行了。

而且开源项目内置了 Case Study Viewer 界面，可以对结果进行交互式浏览与分析。就是下面这样的界面。

如何高效转型Al大模型领域？

作为一名在一线互联网行业奋斗多年的老兵，我深知持续学习和进步的重要性，尤其是在复杂且深入的Al大模型开发领域。为什么精准学习如此关键？

系统的技术路线图：帮助你从入门到精通，明确所需掌握的知识点。
高效有序的学习路径：避免无效学习，节省时间，提升效率。
完整的知识体系：建立系统的知识框架，为职业发展打下坚实基础。

AI大模型从业者的核心竞争力

持续学习能力：Al技术日新月异，保持学习是关键。
跨领域思维：Al大模型需要结合业务场景，具备跨领域思考能力的从业者更受欢迎。
解决问题的能力：AI大模型的应用需要解决实际问题，你的编程经验将大放异彩。

以前总有人问我说：老师能不能帮我预测预测将来的风口在哪里？

现在没什么可说了，一定是Al；我们国家已经提出来：算力即国力！

未来已来，大模型在未来必然走向人类的生活中，无论你是前端，后端还是数据分析，都可以在这个领域上来，我还是那句话，在大语言AI模型时代，只要你有想法，你就有结果！只要你愿意去学习，你就能卷动的过别人！

现在，你需要的只是一份清晰的转型计划和一群志同道合的伙伴。作为一名热心肠的互联网老兵，我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

葡萄城开发者空间

葡萄城是专业的软件开发技术和低代码平台提供商，聚焦软件开发技术，以“赋能开发者”为使命，致力于通过表格控件、低代码和BI等各类软件开发工具和服务

更多推荐

【GitHub项目推荐--Hermes Web UI：给 Hermes Agent 配一个全功能“驾驶舱”】⭐⭐

是专为（NousResearch 开源的多平台 AI Agent 框架）设计的全功能 Web 管理面板。它解决了 Hermes 原生命令行界面（CLI）操作繁琐的痛点，将聊天会话管理、渠道配置、成本监控等能力封装进一个现代化的响应式 Web 界面中。该项目采用 MIT 协议，基于 Vue 3 + Koa 2 技术栈构建，旨在让非技术用户也能轻松管理复杂的 AI 机器人集群。Hermes Web