RAG 进化之路：传统 RAG 到工具与强化学习双轮驱动的 Agentic RAG

阅读收获

核心概念：检索 + 生成，需要两个方面的提升：

离线流水线：文档加载 → 文本切分 → 向量化 → 存储 在线流水线：用户查询 → 文档检索 → Prompt 构建 → LLM 生成

“让 LLM 作为’智能体（Agent）‘充当控制器，结合一组工具执行’思考→行动→观察’的循环”

Agentic RAG 实际上就是指在传统 RAG 基础上，加入了 Agent 组件的 RAG 系统，使其具有自主决策能力。

以开源项目 Chatbox（36.8k stars）为例：

工具设计：

关键洞察：“给模型配备合适的工具和策略性的 Prompt，就能展现出令人惊叹的智能” — 从被动信息检索变为主动决策过程。

通过 RL 训练模型自主决定何时/搜索什么内容，通过策略优化实现”推理-搜索-推理”循环。

方法	决策机制	搜索能力	适应性	实现复杂度
传统 RAG	固定流水线	单次检索	低	低
Prompt 驱动的 Agentic RAG	基于规则	多次检索	中	中
RL 驱动的 Agentic RAG	学习优化	自适应多次检索	高	高