Agent 的可靠性不只取决于模型能力,还取决于模型外部的执行环境、工具协议、上下文管理、编排、可观测性、评估和治理。这里用 ETCLOVG 七层架构系统讲清 Harness Engineering 的设计方法和落地检查项。
Claude Code 通过分层压缩、全量摘要和附件恢复管理长对话上下文。内容覆盖上下文窗口压力来源、常见方案缺陷、Auto-Compact 的触发阈值、消息重组、摘要 prompt 设计和压缩后的接续机制。
Harness Engineering 关注的不是单次提示词怎么写,而是如何把 AI 编程智能体做成可长期运行的系统。内容覆盖上下文管理、工具权限、Session 事件流、Sandbox 隔离、多智能体协作以及可进化记忆架构。
DeepSeek-V4 把上下文窗口扩展到 1M token,同时通过 mHC 残差连接、CSA/HCA 混合稀疏注意力、Muon 优化器、FP4 量化感知训练和 KV Cache 重构解决长上下文带来的计算、显存和训练稳定性问题。
卡片式对话不是把组件塞进聊天框,而是涉及模型输出、Markdown 流式解析、实时数据获取、跨端渲染和事件通信的一整套协议设计。这里系统讲解代码块扩展、占位符、自定义标签、增量 Patch、Tool 驱动以及四层统一协议的落地方式。
Claude Code 不只是一个命令行编程助手,更像一套面向复杂任务的 Agent Runtime。这里从启动链路、REPL 控制面、Query Loop、工具运行时、权限系统、多 Agent 任务系统和 MCP 扩展层拆解它的架构设计。
OpenClaw 的核心价值不只是个人 AI 助理形态,而是它在提示词动态组装、上下文压缩、分层记忆、工具约束和安全护栏上的工程设计。围绕 Prompt、Context、Harness 三个维度,可以拆出一套可迁移到 Agent 系统里的架构方法。
OpenClaw 和 Hermes Agent 都属于通用 Agent 系统,但架构重心不同:OpenClaw 更偏本地优先的 Gateway 控制面,Hermes 更偏会沉淀经验的学习型 Runtime。这里从系统分层、Skills、Memory、安全、安装和迁移几个角度讲清两者的差异与选型思路。
大语言模型本身没有运行时状态,AI Agent 必须在模型外设计记忆系统。围绕 OpenClaw、Claude Code 和 Hermes Agent,拆解文件记忆、上下文工程、情景记忆三种架构路线的机制、适用场景和代价。
Claude Code 是一个运行在命令行里的 AI 编程 Agent。围绕它的架构,可以学习生产级 Agent 如何处理启动初始化、流式工具执行、分层权限、上下文压缩、MCP 集成、Skill 扩展和多 Agent 协作。