RAG 系统的回答质量很大程度取决于检索链路。围绕索引层、查询层、召回层和重排序层,讲清 Parent-Child Chunking、Query 改写、多路召回、RRF 融合和 Rerank 精排的原理、组合方式与取舍。
RAG 系统中,向量召回只能快速找到话题相近的候选内容,不能保证文档真正回答问题。围绕 Bi-Encoder、Cross-Encoder、级联检索、阈值过滤和领域微调,讲清 Rerank 如何减少噪声上下文和幻觉回答。