OpenClaw 为长会话 AI Agent 设计了多层上下文管理机制:调用前裁剪、LLM 摘要压缩、溢出后恢复,以及对 Provider Prompt Caching 成本的兼容。适合用来理解 Agent 如何在效果、稳定性和调用成本之间做取舍。
Clawdbot/OpenClaw 的高 Token 消耗主要来自系统提示词、ReAct 多轮循环、工具结果回灌和反射重试。围绕这些成本来源,拆解计算模型、典型场景和缓存、工作流、上下文压缩、工具裁剪、模型路由等降本手段。