RAG 应用的基础架构拆解

hello@example.com (Ivan) — Wed, 17 Jun 2026 00:00:00 +0000

RAG 是把外部知识接入大模型的常见方式。它并不神秘，本质上是一条从文档到答案的工程链路。

文档切分
#

文档需要被切成适合检索的片段。切分太大，召回不精准；切分太小，上下文容易丢失。常见做法是按标题、段落和固定 token 数组合切分。