什么是 RAG
RAG(Retrieval-Augmented Generation,检索增强生成)是目前最主流的 LLM 落地架构之一。
核心思想:让 LLM 在回答问题时,先从外部知识库中检索相关内容,再基于检索结果生成回答。
解决 LLM 的两大痛点
- 知识截止日期:模型不知道训练后发生的事
- 幻觉问题:模型在不确定时会编造答案
RAG 工作流程
离线索引阶段
- 原始文档切分成小块
- 通过 Embedding 模型转换为向量
- 存入向量数据库
在线查询阶段
- 用户问题转换为向量
- 从向量数据库中找到最相似的文档块
- 拼接成上下文交给 LLM 生成答案
RAG 完整流程
- 用户提问
- Embedding:转为查询向量
- 向量数据库:相似度检索 Top-K
- Prompt 拼接:问题 + 文档块
- LLM 生成:基于检索结果作答
RAG 的优势
- 提供最新、最准确的信息
- 减少幻觉,提高可信度
- 可以接入私有知识库
- 答案可溯源
来源:菜鸟教程 | 原文链接