人工智能 #LLM #Agent #Harness Engineering #MCP #沙箱 #可观测性 #评估 #安全治理

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

Agent 的可靠性不只取决于模型能力，还取决于模型外部的执行环境、工具协议、上下文管理、编排、可观测性、评估和治理。这里用 ETCLOVG 七层架构系统讲清 Harness Engineering 的设计方法和落地检查项。

发布于 2026-05-25

人工智能 #AI Agent #GitHub #Claude Code #代码知识图谱 #端侧 TTS #多智能体

9 个 AI 工程开源项目：Agent 技能、代码知识图谱、端侧 TTS 与视频工作流

围绕近期热度较高的 9 个 AI 工程开源项目，梳理它们分别解决什么问题、核心机制是什么、适合哪些场景，以及科研写作、代码理解、Agent 工程化、端侧语音和 AI 视频生成中的选型思路。

发布于 2026-05-24

后端 #Claude Code #Harness #Hooks #Subagents #数仓 #Context Compact #SQL 规范 #CLAUDE.md

用 Claude Code Harness 搭建数仓 AI 开发流水线

Claude Code 用在数仓开发时，常见问题是上下文压缩后遗忘约束、SQL 规范执行不稳定、高 token 操作污染主会话。围绕 Harness、Hooks、Subagents、CLAUDE.md 和 SKILL 改造，可以把 AI 编码从临时对话升级为可验证、可持久化、可隔离的研发流水线。

发布于 2026-05-20

人工智能 #AI Skill #LLM Agent #自动评测 #Ground Truth #Trace #Git Rollback #门控

用 8 阶段循环训练可自进化的 AI Skill

Skill 不只是 prompt，而是一套由说明、资料、脚本和评测共同组成的能力单元。通过 8 阶段迭代循环、三层评测、5 维 AND 门控和 Trace 诊断，可以把 Skill 当成可训练对象，让它在数据和指标约束下自动改进。

发布于 2026-05-19

人工智能 #Agent #LLM #agno #ReAct #Multi-Agent #Workflow #Tree-of-Thoughts #Memory

17 种 Agent 架构演进：从单次生成到可控执行系统

Agent 架构的核心不是提示词技巧，而是状态、控制流和评估器的设计。围绕 Reflection、Tool Use、ReAct、Planning、PEV、多 Agent、记忆、搜索、模拟和安全闸门等 17 种模式，系统拆解它们解决的问题、拓扑结构、适用场景和工程代价。

发布于 2026-05-18

人工智能 #Claude Code #AI Agent #上下文窗口 #Auto-Compact #Prompt Cache #大语言模型

Claude Code Auto-Compact 上下文压缩机制解析

Claude Code 通过分层压缩、全量摘要和附件恢复管理长对话上下文。内容覆盖上下文窗口压力来源、常见方案缺陷、Auto-Compact 的触发阈值、消息重组、摘要 prompt 设计和压缩后的接续机制。

发布于 2026-05-18

人工智能 #AI Agent #Agent Skills #SKILL.md #Aone Copilot #Prompt Engineering #自动化测试 #跨平台

AI Agent Skill 开发指南：从 SKILL.md 到发布、评测与跨平台迁移

Skill 是给 AI Agent 使用的结构化指令包，用来沉淀可复用的工作流。内容覆盖 Skill 的加载机制、SKILL.md 写法、安装发布流程、跨平台兼容、版本治理、调试评测，以及如何用一个开发助手 Skill 管理完整开发闭环。

发布于 2026-05-18

人工智能 #Claude Code #academic-research-skills #多智能体 #学术写作 #引用核验 #AI审稿

用 academic-research-skills 搭建 Claude Code 论文研究流水线

academic-research-skills 是一套面向 Claude Code 的学术研究技能包，把文献调研、论文写作、模拟审稿和修订定稿组织成流水线。重点讲清它的四个 Skill、完整性闸门、引用核验、反谄媚协议和上手方式。

发布于 2026-05-17

人工智能 #Codex #ChatGPT #Agent #CLI #Skills #MCP #自动化 #本地文件

Codex 桌面 Agent 入门：项目、权限、插件、Skills 与自动化任务

Codex 是 OpenAI 面向桌面工作的 Agent，可以读写项目文件、执行终端命令、调用浏览器和插件，并把固定流程沉淀成 Skills 或自动化任务。围绕安装、项目权限、文件操作、命令行、记忆、插件、MCP 和手机控制，完整讲清它的使用方法和注意事项。

发布于 2026-05-16

软件工程 #Codex App #ChatGPT iOS #SSH #远程开发 #AI 编程 #浏览器自动化

用 ChatGPT iOS 控制 Codex App：移动端连接多台电脑的配置指南

Codex App 的移动端入口集成在 ChatGPT iOS 中，可以把手机作为远程控制台给本机或云端 Codex 派发任务。这里梳理版本更新、权限模式、多电脑绑定、SSH 连接和常见坑，帮助把移动端 Codex 配成稳定的远程开发入口。

发布于 2026-05-15

菜单

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

9 个 AI 工程开源项目：Agent 技能、代码知识图谱、端侧 TTS 与视频工作流

用 Claude Code Harness 搭建数仓 AI 开发流水线

用 8 阶段循环训练可自进化的 AI Skill

17 种 Agent 架构演进：从单次生成到可控执行系统

Claude Code Auto-Compact 上下文压缩机制解析

AI Agent Skill 开发指南：从 SKILL.md 到发布、评测与跨平台迁移

用 academic-research-skills 搭建 Claude Code 论文研究流水线

Codex 桌面 Agent 入门：项目、权限、插件、Skills 与自动化任务

用 ChatGPT iOS 控制 Codex App：移动端连接多台电脑的配置指南

从 Prompt 到 Agent Loop：让 AI Agent 稳定工作的循环设计方法

Loop Engineering：让 Agent 自己完成开发、验证与迭代

8 个能控制电脑的开源 AI Agent 项目对比

Claude Fable 5首日实测，杀疯了…

用 ChatGPT iOS 控制 Codex App：移动端连接多台电脑的配置指南

7 个前端设计 Skill 横评：视觉效果、代码质量与适用场景

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

Fastjson 1.2.83 序列化与反序列化源码机制解析

SDD-RIPER 团队落地指南：用 Spec 和阶段门禁管住大模型编程

Claude Code 的 Prompt、Context 与 Harness 工程设计拆解