X 平台开源的新推荐系统把排序核心转向 Transformer 模型,通过 Thunder、Phoenix 两条候选来源生成信息流,再用多行为概率加权打分。梳理候选召回、排序、过滤、多样性和 OON 调分等关键机制。
RAG 通过“先检索外部知识,再让大语言模型生成回答”的方式缓解幻觉、知识过期和私有数据接入问题。内容覆盖 RAG 的基础架构、常见故障、RAG-Fusion、多路检索、索引优化、安全防护和未来演进方向。
RAG 的召回质量很大程度取决于文档如何分块。围绕中文知识库场景,系统讲解固定长度、句子、递归、结构感知、语义、主题、父子段和混合分块的原理、代码实现、适用场景与调参方法。
RAG 系统要处理的不只是向量召回,还包括重排序、结构化数据查询、表格解析和复杂图推理。围绕语义检索、Text2SQL 和 GraphRAG 三条主线,拆解一套可落地 RAG 架构的训练方法、检索流程和工程取舍。