用 8 阶段循环训练可自进化的 AI Skill

Skill 不只是 prompt,而是一套由说明、资料、脚本和评测共同组成的能力单元。通过 8 阶段迭代循环、三层评测、5 维 AND 门控和 Trace 诊断,可以把 Skill 当成可训练对象,让它在数据和指标约束下自动改进。

发布于 2026-05-19

17 种 Agent 架构演进:从单次生成到可控执行系统

Agent 架构的核心不是提示词技巧,而是状态、控制流和评估器的设计。围绕 Reflection、Tool Use、ReAct、Planning、PEV、多 Agent、记忆、搜索、模拟和安全闸门等 17 种模式,系统拆解它们解决的问题、拓扑结构、适用场景和工程代价。

发布于 2026-05-18

Claude Code Auto-Compact 上下文压缩机制解析

Claude Code 通过分层压缩、全量摘要和附件恢复管理长对话上下文。内容覆盖上下文窗口压力来源、常见方案缺陷、Auto-Compact 的触发阈值、消息重组、摘要 prompt 设计和压缩后的接续机制。

发布于 2026-05-18

AI Agent Skill 开发指南:从 SKILL.md 到发布、评测与跨平台迁移

Skill 是给 AI Agent 使用的结构化指令包,用来沉淀可复用的工作流。内容覆盖 Skill 的加载机制、SKILL.md 写法、安装发布流程、跨平台兼容、版本治理、调试评测,以及如何用一个开发助手 Skill 管理完整开发闭环。

发布于 2026-05-18

用 academic-research-skills 搭建 Claude Code 论文研究流水线

academic-research-skills 是一套面向 Claude Code 的学术研究技能包,把文献调研、论文写作、模拟审稿和修订定稿组织成流水线。重点讲清它的四个 Skill、完整性闸门、引用核验、反谄媚协议和上手方式。

发布于 2026-05-17

Codex 桌面 Agent 入门:项目、权限、插件、Skills 与自动化任务

Codex 是 OpenAI 面向桌面工作的 Agent,可以读写项目文件、执行终端命令、调用浏览器和插件,并把固定流程沉淀成 Skills 或自动化任务。围绕安装、项目权限、文件操作、命令行、记忆、插件、MCP 和手机控制,完整讲清它的使用方法和注意事项。

发布于 2026-05-16

用 ChatGPT iOS 控制 Codex App:移动端连接多台电脑的配置指南

Codex App 的移动端入口集成在 ChatGPT iOS 中,可以把手机作为远程控制台给本机或云端 Codex 派发任务。这里梳理版本更新、权限模式、多电脑绑定、SSH 连接和常见坑,帮助把移动端 Codex 配成稳定的远程开发入口。

发布于 2026-05-15

Deep Research Agent 的 FC-SFT 冷启动:从 71% 到 94% 的工具调用准确率如何做出来

Deep Research Agent 要稳定完成多工具协同,不能只依赖通用模型的原生 Function Calling。围绕 FC-SFT 冷启动链路,讲清种子数据构造、Teacher 轨迹生成、质量过滤、防遗忘混合训练和评估闭环。

发布于 2026-05-13

用 AgentSight 看清 ANOLISA 中 Agent 的 Token 消耗明细

Agent 运行时的 Token 成本往往来自系统提示词、历史消息、工具调用和重复上下文回放。AgentSight 是 ANOLISA 的可观测组件,可以监控 Agent 状态、追踪 LLM 调用、按会话和对话拆解 Token 消耗,并通过命令行或可视化面板定位成本异常。

发布于 2026-05-11

AI 工程交付中的知识沉淀:Harness 工作流的知识库架构设计

Harness Engineering 的关键不只是编排 Agent 工作流,更要让团队经验持续沉淀成可复用的知识资产。围绕知识分层、Git 化协作、按需检索、生命周期治理和异步人机协作,讲清 AI 工程交付系统该如何设计知识闭环。

发布于 2026-05-11