RAG 系统中,向量召回只能快速找到话题相近的候选内容,不能保证文档真正回答问题。围绕 Bi-Encoder、Cross-Encoder、级联检索、阈值过滤和领域微调,讲清 Rerank 如何减少噪声上下文和幻觉回答。