大语言模型在复杂任务中容易遇到幻觉、信息过期、规划不足和错误传播问题。ReAct 通过“推理 + 行动 + 观察”让模型调用外部工具完成多步任务,Reflexion 再加入评估、反思和记忆,让 Agent 能从失败轨迹中改进下一次尝试。
上下文工程关注的不再是单条提示词怎么写,而是如何为大语言模型动态组织指令、记忆、工具、检索结果和输出格式。围绕 LangChain、Claude Code、Manus 和 Kiro 的实践,可以看到 Agent 系统从 Prompt 驱动走向 Context 驱动的工程化路径。
Claude Skills 将 Agent 完成特定任务所需的指令、脚本、参考资料和素材打包成标准文件夹。内容围绕目录结构、分层加载机制、与 MCP 的关系,以及开发者如何用同样模式管理自研 Agent 能力库展开。
LLM 不是确定性的开发者,而是基于上下文预测 Token 的概率模型。围绕 p^n 成功率衰减、上下文舒适区、Unknown Unknown 错误和责任边界,讲清如何设计更可靠的人机协同开发流程。
多智能体框架的差异主要体现在协作抽象、工具调用、状态管理、可观测性和部署能力上。围绕 Swarm、OpenAI Agents SDK、Qwen-Agent、Dify、CrewAI、AutoGen 等 10 个框架,梳理学习、开发、生产三个阶段的选型思路。
后台定时 Agent 能按计划自动采集数据、调用大语言模型分析结果,并在风险场景中触发人工确认。围绕 Spring AI Alibaba 的 StateGraph、CompiledGraph 和 schedule 机制,讲清定时 Agent 的设计方式、代码实现和落地注意事项。
Agentic Context Engineering 将系统提示、记忆、工具经验和领域规则组织成可持续演化的“作战手册”,让大型语言模型在不更新参数的情况下通过执行反馈改进表现。这里讲清 ACE 的问题背景、生成器-反思器-整编器架构、增量更新机制、实验结果和适用边界。