用 Mem0 和 Milvus 构建具备长期记忆的 AI Agent

Mem0 可以为 AI Agent 提供跨会话的长期记忆能力,Milvus 负责持久化存储和检索语义向量。这里会讲清 Mem0 的记忆机制、它和 RAG 的区别,以及如何结合 DashScope、LangGraph、Milvus 和 Kuzu 构建带长期记忆与图谱记忆的 AI 应用。

发布于 2025-09-17

Claude Code 为什么选择 grep 而不是代码索引:无状态设计的工程取舍

Claude Code 没有把预构建代码索引作为核心能力,而是更依赖 glob、grep 等实时搜索工具。围绕这个选择,可以理解无状态设计在可组合性、确定性、隐私和维护成本上的优势,以及它与向量索引、传统 IDE 索引各自适合的场景。

发布于 2025-09-16

MySQL 单表 2000 万行建议值的计算逻辑

2000 万行并不是 MySQL 单表硬上限,而是基于 InnoDB 16KB 数据页、B+树高度和单行大小推导出来的经验值。理解数据页、聚簇索引和扇出之后,就能判断自己的表什么时候需要拆分或归档。

发布于 2025-09-15

多智能体 ReAct 自主规划的五个工程优化策略

多智能体 ReAct 自主规划能让主智能体拆解任务并调度工具或子智能体,但生产环境容易遇到工具调用等待长、上下文膨胀、中间产物缺失、结束回答敷衍和规划跑偏等问题。这里围绕五个工程策略讲清问题成因、系统设计和落地实现。

发布于 2025-09-09

工程级 RAG 系统架构:语义检索、Text2SQL 与 GraphRAG 的协同设计

RAG 不只是向量检索加大模型生成。一个工程级 RAG 系统需要同时处理语义文档、结构化表格、数据库和知识图谱,并通过 Embedding、Reranker、Text2SQL 与 GraphRAG 协同完成复杂问答。

发布于 2025-09-08

面向生产环境的 RAG 系统设计:Embedding、Reranker、Text2SQL 与 GraphRAG

RAG 系统要处理的不只是向量召回,还包括重排序、结构化数据查询、表格解析和复杂图推理。围绕语义检索、Text2SQL 和 GraphRAG 三条主线,拆解一套可落地 RAG 架构的训练方法、检索流程和工程取舍。

发布于 2025-08-28