RAG 技术要点速查
检索增强生成(RAG)技术核心要点速查表,涵盖架构流程、向量检索、文档处理等关键知识点,帮助理解 LLM 应用开发。 ✨
Article Points:
1
RAG = Retrieval + Augmented + Generation,检索增强生成
2
流程: 用户问题 → 向量化 → 相似度检索 → 上下文增强 → LLM 生成
3
Embedding: 将文本转为高维向量,常用 text-embedding-ada-002
4
向量数据库: Pinecone, Milvus, Chroma, Faiss, Weaviate
5
文档切分: 按段落/句子切分,保持语义完整,适当重叠
6
检索策略: 相似度检索, 混合检索(关键词+向量), 重排序
7
Prompt模板: 将检索结果注入 Prompt 作为上下文参考
Source:
RAG 技术要点速查
RAG 技术要点速查
A[用户问题] --> B[Embedding 模型]
B --> C[向量化查询]
C --> D[向量数据库检索]
D --> E[相关文档片段]
E --> F[Prompt 组装]
A --> F
F --> G[LLM 生成]
G --> H[答案输出]
subgraph 离线索引
I[文档] --> J[切分]
J --> K[Embedding]
K --> L[存入向量库]
end
Source:
RAG 技术要点速查
Next Card