Skill 不只是 prompt,而是一套由说明、资料、脚本和评测共同组成的能力单元。通过 8 阶段迭代循环、三层评测、5 维 AND 门控和 Trace 诊断,可以把 Skill 当成可训练对象,让它在数据和指标约束下自动改进。
Agent 架构的核心不是提示词技巧,而是状态、控制流和评估器的设计。围绕 Reflection、Tool Use、ReAct、Planning、PEV、多 Agent、记忆、搜索、模拟和安全闸门等 17 种模式,系统拆解它们解决的问题、拓扑结构、适用场景和工程代价。
Claude Code 通过分层压缩、全量摘要和附件恢复管理长对话上下文。内容覆盖上下文窗口压力来源、常见方案缺陷、Auto-Compact 的触发阈值、消息重组、摘要 prompt 设计和压缩后的接续机制。
Skill 是给 AI Agent 使用的结构化指令包,用来沉淀可复用的工作流。内容覆盖 Skill 的加载机制、SKILL.md 写法、安装发布流程、跨平台兼容、版本治理、调试评测,以及如何用一个开发助手 Skill 管理完整开发闭环。
academic-research-skills 是一套面向 Claude Code 的学术研究技能包,把文献调研、论文写作、模拟审稿和修订定稿组织成流水线。重点讲清它的四个 Skill、完整性闸门、引用核验、反谄媚协议和上手方式。
Codex App 的移动端入口集成在 ChatGPT iOS 中,可以把手机作为远程控制台给本机或云端 Codex 派发任务。这里梳理版本更新、权限模式、多电脑绑定、SSH 连接和常见坑,帮助把移动端 Codex 配成稳定的远程开发入口。
Deep Research Agent 要稳定完成多工具协同,不能只依赖通用模型的原生 Function Calling。围绕 FC-SFT 冷启动链路,讲清种子数据构造、Teacher 轨迹生成、质量过滤、防遗忘混合训练和评估闭环。
Agent 运行时的 Token 成本往往来自系统提示词、历史消息、工具调用和重复上下文回放。AgentSight 是 ANOLISA 的可观测组件,可以监控 Agent 状态、追踪 LLM 调用、按会话和对话拆解 Token 消耗,并通过命令行或可视化面板定位成本异常。
Harness Engineering 的关键不只是编排 Agent 工作流,更要让团队经验持续沉淀成可复用的知识资产。围绕知识分层、Git 化协作、按需检索、生命周期治理和异步人机协作,讲清 AI 工程交付系统该如何设计知识闭环。