上下文工程关注的不再是单条提示词怎么写,而是如何为大语言模型动态组织指令、记忆、工具、检索结果和输出格式。围绕 LangChain、Claude Code、Manus 和 Kiro 的实践,可以看到 Agent 系统从 Prompt 驱动走向 Context 驱动的工程化路径。
多智能体框架的差异主要体现在协作抽象、工具调用、状态管理、可观测性和部署能力上。围绕 Swarm、OpenAI Agents SDK、Qwen-Agent、Dify、CrewAI、AutoGen 等 10 个框架,梳理学习、开发、生产三个阶段的选型思路。
GraphRAG 把文档切块后抽取实体、关系和声明,构建知识图并用社区检测生成分层摘要,再通过 Map-Reduce 回答面向整个语料库的问题。内容涵盖简单 RAG 的局限、索引流程、查询流程、评估结果和落地注意事项。
通义体系不只是聊天模型,而是由基础模型、多模态模型、模型服务平台和业务应用组成的一套能力栈。系统拆解 Qwen、DashScope、RAG 和智能体在企业应用中的分工,并给出 API 调用与落地注意事项。
Deep Research 是一种面向开放研究任务的智能体系统,核心能力是自主规划、生成检索问题、探索网页并产出带证据的报告。围绕系统架构、数据构造、奖励设计和强化学习训练流程,梳理从原型实现到可靠性优化的关键技术。
Deep Research 类智能体不能只靠“规划、检索、生成”拼报告。Google Deep Researcher 引入 Test-Time Diffusion,把报告草稿当作可迭代去噪的状态,用草稿反向指导检索,再通过报告级改写融合证据,从而改善长报告的一致性、结构和推理质量。
Mem0 可以为 AI Agent 提供跨会话的长期记忆能力,Milvus 负责持久化存储和检索语义向量。这里会讲清 Mem0 的记忆机制、它和 RAG 的区别,以及如何结合 DashScope、LangGraph、Milvus 和 Kuzu 构建带长期记忆与图谱记忆的 AI 应用。
Claude Code 没有把预构建代码索引作为核心能力,而是更依赖 glob、grep 等实时搜索工具。围绕这个选择,可以理解无状态设计在可组合性、确定性、隐私和维护成本上的优势,以及它与向量索引、传统 IDE 索引各自适合的场景。
RAG 不只是向量检索加大模型生成。一个工程级 RAG 系统需要同时处理语义文档、结构化表格、数据库和知识图谱,并通过 Embedding、Reranker、Text2SQL 与 GraphRAG 协同完成复杂问答。
Context Engineering 关注在调用大语言模型前,如何把指令、知识、工具结果和记忆组织进有限上下文窗口。围绕 LLM OS 类比、上下文失败模式、记忆分类和工程实践,系统讲清 LLM 应用为什么不能只靠提示词。