RAG 系统跑通 Demo 并不难,难点在于把知识库问答调到生产可用。核心问题集中在文档预处理、检索质量调优和效果评估三层,每一层都会直接影响最终回答质量。
围绕淘宝闪购 AI 工程岗终面常见问题,系统拆解 RAG、Embedding、相似度计算、Prompt 注入防护、Agent 演进、文件上传、权限过滤和 AI Coding 等核心知识点,帮助把 AI 项目讲得完整、可信、可落地。
RAG 系统的回答质量很大程度取决于检索链路。围绕索引层、查询层、召回层和重排序层,讲清 Parent-Child Chunking、Query 改写、多路召回、RRF 融合和 Rerank 精排的原理、组合方式与取舍。
RAG 系统做文档切割时,固定长度分块容易把完整语义拆散,导致向量检索召回失败。这里系统讲解重叠切割、语义边界切割、句子窗口检索、父子切割、命题化切割和 Contextual Retrieval 的原理、实现方式与选型取舍。
OpenClaw 将智能体记忆拆成动态会话日志和静态长期记忆,并通过 Markdown、JSONL、Embedding、sqlite-vec 和 FTS5 构建可持久化、可检索的记忆系统。重点讲清它如何写入记忆、索引记忆、召回记忆,以及为什么有了记忆层后 token 成本仍然不低。
RAG 通过“先检索外部知识,再让大语言模型生成回答”的方式缓解幻觉、知识过期和私有数据接入问题。内容覆盖 RAG 的基础架构、常见故障、RAG-Fusion、多路检索、索引优化、安全防护和未来演进方向。
RAG 的召回质量很大程度取决于文档如何分块。围绕中文知识库场景,系统讲解固定长度、句子、递归、结构感知、语义、主题、父子段和混合分块的原理、代码实现、适用场景与调参方法。
RAG 不只是向量检索加大模型生成。一个工程级 RAG 系统需要同时处理语义文档、结构化表格、数据库和知识图谱,并通过 Embedding、Reranker、Text2SQL 与 GraphRAG 协同完成复杂问答。
RAG 系统要处理的不只是向量召回,还包括重排序、结构化数据查询、表格解析和复杂图推理。围绕语义检索、Text2SQL 和 GraphRAG 三条主线,拆解一套可落地 RAG 架构的训练方法、检索流程和工程取舍。