人工智能 #Codex #Record & Replay #Computer Use #Skill #桌面自动化 #MCP

Codex Record & Replay：把桌面操作录成可复用 Skill

Codex Record & Replay 可以把一次桌面操作演示沉淀为可复用 skill，用于后续自动执行类似任务。内容围绕工作原理、启用步骤、Computer Use 等底层能力、适用边界和安全注意事项展开。

发布于 2026-06-19

人工智能 #Agent #Loop Engineering #AI Coding #Claude Code #Codex #Git Worktree #自动化

Loop Engineering：让 Agent 自己完成开发、验证与迭代

Loop Engineering 是一种面向 Agent 的闭环工程方法，把开发、测试、验收、反馈和迭代设计成可自动运行的流程。它不是简单的 Agent 内部循环，而是让 Agent 在更上层的任务闭环里持续逼近目标。

发布于 2026-06-18

人工智能 #Harness #Agent #LLM #工作流评测 #自动化测试 #Prompt Engineering #质量度量

Harness 工作流评测系统：用考试机制量化 Agent 质量

Harness 工作流由 Prompt、规则、技能和模型共同决定，行为天然不稳定，不能只靠体感判断好坏。通过题库、考官、裁判、执行引擎和结果归因，可以建立一套可重复、可回归、可驱动改进的评测闭环。

发布于 2026-06-18

人工智能 #Loop Engineering #AI Agent #Claude Code #自动化 #任务验证 #上下文工程

Loop Engineering：让 AI Agent 自己推进任务的循环系统

Loop Engineering 是在单次 AI Agent 运行之上设计自动循环，让系统能够发现任务、生成方案、验证结果、记录状态并决定下一步。核心不是写更长的提示词，而是搭建一个能持续推进任务、可验证、可恢复的 Agent 工作流。

发布于 2026-06-17

人工智能 #Token #大语言模型 #Prompt Cache #KV Cache #AI 编程 #MCP #Claude Code

AI 编程工具的 Token 成本机制：缓存、配置与对话策略

AI 编程工具的一次调用不只包含用户输入，还会带上系统指令、工具定义、配置规则和历史消息。掌握 Token 计费、缓存命中、配置加载和会话管理方式，可以显著减少重复消耗。

发布于 2026-06-17

人工智能 #AI Agent #Eval #Rubric #Trace #LLM-as-Judge #MCP #自动化测试

AI Agent 测评体系设计：从评分器、用例集到工程落地

AI Agent 从演示走向生产，需要一套可重复、可量化、可回归的测评体系。围绕评分器选择、测评维度、用例设计、基线管理、稳定性评估和流水线落地，系统讲清如何搭建 Agent 与 Skill 的工程化测评方案。

发布于 2026-06-16

人工智能 #Agent Loop #AI Agent #Prompt Engineering #多 Agent #Guardrails #Memory

从 Prompt 到 Agent Loop：让 AI Agent 稳定工作的循环设计方法

Agent Loop 的重点不是写一段更长的 Prompt，而是设计目标、上下文、工具、记忆、反馈和停止条件组成的执行循环。这里系统讲清 Agent Loop 的核心结构、多 Agent 编排方式、治理层设计，以及实际落地时最容易踩的坑。

发布于 2026-06-16

人工智能 #Agent Loop #AI Agent #LLM #ReAct #LangGraph #多智能体 #上下文工程

Agent Loop 工程化：让 AI Agent 自主执行又能及时停下

Agent Loop 是让大语言模型从一次性文本生成器变成自主行动者的核心结构。围绕感知、推理、规划、行动、观察的循环机制，可以构建能使用工具、处理错误、控制成本并按条件停止的生产级 AI Agent。

发布于 2026-06-16

后端 #AI Agent #AI Coding #微服务 #架构治理 #Harness #可观测性 #CI/CD #权限控制

面向 AI Agent 的后端架构改造：从系统事实到无人值守开发

后端系统要让 AI Agent 安全参与开发、排障和发布，关键是把架构、服务、领域、接口、数据和运行态知识结构化，并用 Harness、测试、权限和 CI/CD 把自动化变成可验证流程。

发布于 2026-06-15

人工智能 #Loop Engineering #AI Agent #提示词工程 #工作流自动化 #CI #代码审查

Loop Engineering：让 AI Agent 从提示词对话变成可运行闭环

Loop Engineering 是一种把 AI Agent 放进闭环工作流里的方法。它不再只关注单次提示词，而是设计触发、执行、验证、记忆和人工接管机制，让 AI 能持续推进可检查的任务。

发布于 2026-06-14

菜单

Codex Record & Replay：把桌面操作录成可复用 Skill

Loop Engineering：让 Agent 自己完成开发、验证与迭代

Harness 工作流评测系统：用考试机制量化 Agent 质量

Loop Engineering：让 AI Agent 自己推进任务的循环系统

AI 编程工具的 Token 成本机制：缓存、配置与对话策略

AI Agent 测评体系设计：从评分器、用例集到工程落地

从 Prompt 到 Agent Loop：让 AI Agent 稳定工作的循环设计方法

Agent Loop 工程化：让 AI Agent 自主执行又能及时停下

面向 AI Agent 的后端架构改造：从系统事实到无人值守开发

Loop Engineering：让 AI Agent 从提示词对话变成可运行闭环

从 Prompt 到 Agent Loop：让 AI Agent 稳定工作的循环设计方法

Loop Engineering：让 Agent 自己完成开发、验证与迭代

8 个能控制电脑的开源 AI Agent 项目对比

Claude Fable 5首日实测，杀疯了…

用 ChatGPT iOS 控制 Codex App：移动端连接多台电脑的配置指南

7 个前端设计 Skill 横评：视觉效果、代码质量与适用场景

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

Fastjson 1.2.83 序列化与反序列化源码机制解析

SDD-RIPER 团队落地指南：用 Spec 和阶段门禁管住大模型编程

Claude Code 的 Prompt、Context 与 Harness 工程设计拆解