Claude Code 通过分层压缩、全量摘要和附件恢复管理长对话上下文。内容覆盖上下文窗口压力来源、常见方案缺陷、Auto-Compact 的触发阈值、消息重组、摘要 prompt 设计和压缩后的接续机制。
解释大语言模型如何把提示词、历史对话和用户问题转成 token 与向量,经过 Transformer、自注意力和位置编码完成上下文建模,再通过概率采样逐 token 生成回答,并给出上下文控制、多 Agent 拆分等工程实践建议。