TencentDB Agent Memory 为 AI Agent 提供长期记忆和短期记忆能力,让智能体能记住用户事实、偏好和任务上下文。围绕它的核心机制、评测数据、接入方式和落地风险,系统讲清 Agent 记忆模块该怎么设计。
RAG 系统跑通 Demo 并不难,难点在于把知识库问答调到生产可用。核心问题集中在文档预处理、检索质量调优和效果评估三层,每一层都会直接影响最终回答质量。
围绕淘宝闪购 AI 工程岗终面常见问题,系统拆解 RAG、Embedding、相似度计算、Prompt 注入防护、Agent 演进、文件上传、权限过滤和 AI Coding 等核心知识点,帮助把 AI 项目讲得完整、可信、可落地。
Claude Code 和 Codex 在代码搜索中都选择了零索引路线:不用 embedding,不建向量库,而是让 LLM 驱动 ripgrep 多轮搜索。围绕工具调用循环、ripgrep 性能、Cursor 对比和 token 成本,讲清这种架构为什么在本地代码库里成立。
RAG 系统的回答质量很大程度取决于检索链路。围绕索引层、查询层、召回层和重排序层,讲清 Parent-Child Chunking、Query 改写、多路召回、RRF 融合和 Rerank 精排的原理、组合方式与取舍。
介绍 Rowboat、DeepTutor、andrej-karpathy-skills、claude-mem、ChinaTextbook、MarkItDown 和 VoxCPM 的核心用途、工作方式、适用场景与上手命令,覆盖多 Agent 编排、Claude Code 约束与记忆、文档转换、教材资源和语音合成。
RAG 系统做文档切割时,固定长度分块容易把完整语义拆散,导致向量检索召回失败。这里系统讲解重叠切割、语义边界切割、句子窗口检索、父子切割、命题化切割和 Contextual Retrieval 的原理、实现方式与选型取舍。
RAG 系统中,向量召回只能快速找到话题相近的候选内容,不能保证文档真正回答问题。围绕 Bi-Encoder、Cross-Encoder、级联检索、阈值过滤和领域微调,讲清 Rerank 如何减少噪声上下文和幻觉回答。
Agent 记忆模块不能只把聊天记录塞进数据库。合理的设计需要区分工作记忆、情景记忆、语义记忆和程序记忆,并围绕写入、检索、反思、遗忘和存储架构做工程取舍。
围绕 AI 编程、智能体运行时、沙箱、爬虫、无头浏览器、上下文数据库和代码知识图谱,梳理 12 个开源项目的核心能力、适用场景和选型思路。