归档 - 全栈研发笔记

Harness Engineering 实践：用 AI Agent 自动评测并迭代优化系统

2026-04-29

人工智能 #AI Agent #Harness Engineering #自动化评测 #UI测试 #MCP #Rubrics #AI Coding

围绕 Harness Engineering 的落地方式，讲清楚如何把评测任务、评测集、评测报告抽象成 AI Agent 可操作的平台能力，让智能体自动生成用例、执行无 UI 与 UI 评测，并基于报告进行多轮系统优化。

用 GPT 生成词语视觉化概念海报的 Prompt 模板

2026-04-28

人工智能 #GPT #Prompt工程 #图像生成 #海报设计 #视觉隐喻 #提示词工程

围绕支持图像生成的 GPT，拆解一套“词语到概念海报”的提示词设计方法：先理解语义和情绪，再用巨型文字、承载面、主体动作和克制配色把抽象词视觉化。

DeepSeek-V4 的 1M 上下文架构：mHC、CSA/HCA 与训练推理优化

2026-04-28

人工智能 #DeepSeek-V4 #大模型 #长上下文 #MoE #稀疏注意力 #KV Cache #TileLang #量化感知训练

DeepSeek-V4 把上下文窗口扩展到 1M token，同时通过 mHC 残差连接、CSA/HCA 混合稀疏注意力、Muon 优化器、FP4 量化感知训练和 KV Cache 重构解决长上下文带来的计算、显存和训练稳定性问题。

Harness Engineering 工程实践：让 AI Agent 稳定交付代码

2026-04-28

人工智能 #Harness Engineering #AI Agent #Cursor #自动化验证 #多 Agent 协作 #CI/CD #Prompt Engineering

Harness Engineering 的核心不是把 Prompt 写得更长，而是为 AI Agent 搭建可执行、可验证、可回退的工程环境。内容覆盖多 Agent 协作、Rules/Skills/Scripts 分层、事后验证、测试基线和人类在 AI 编程流程中的职责变化。

code-review-graph：用代码图谱降低 AI 读代码的 Token 成本

2026-04-28

人工智能 #code-review-graph #Claude Code #MCP #Tree-sitter #SQLite #代码图谱 #AI Coding

code-review-graph 会把代码库预解析为函数、类、调用、依赖组成的结构化图谱，并通过 MCP 提供给 Claude Code 等 AI 编程工具查询。借助影响半径分析和增量索引，它能减少大项目中反复全文读代码带来的 token 浪费。

AI Agent 工程架构：从循环控制到上下文、工具、记忆与评测

2026-04-28

人工智能 #AI Agent #LLM #上下文工程 #工具调用 #记忆系统 #多 Agent #Agent 评测 #可观测性

AI Agent 的稳定性不只取决于模型能力，更取决于循环控制、上下文组织、工具设计、记忆系统、评测体系和安全边界。围绕这些工程要素，可以把 Agent 从一个会调用工具的聊天程序，建设成可验证、可追踪、可恢复的长期运行系统。

LLM 工作流 Skill 编写指南：结构、触发机制与 6 种设计模式

2026-04-27

人工智能 #LLM #Agent Skills #工作流 #Prompt Engineering #YAML #Markdown

LLM 工作流 Skill 通过 SKILL.md 把流程、约束、示例和参考资料注入到模型上下文中。内容系统讲解 Skill 的加载机制、frontmatter 写法、6 种常见设计模式，以及可直接改造的模板。

13 个 GitHub 开源项目：AI 编程、Agent、SRE 与安全工具速览

2026-04-26

开源项目 #GitHub #AI Agent #Claude Code #OpenAI Agents SDK #MCP #SRE #安全工具 #CUDA

围绕 AI 编程、Agent 框架、代码库检索、生产故障排查、安全工具和 GPU 内核优化，梳理 13 个 GitHub 开源项目的核心能力、适用场景和使用限制，帮助快速判断哪些工具适合放进自己的开发工作流。

用 JSON Schema 让大模型稳定输出结构化数据

2026-04-26

人工智能 #大模型 #JSON Schema #Structured Outputs #Function Calling #Pydantic #jsonschema #API 集成

大模型接入业务系统时，单靠“请输出 JSON”很容易出现字段缺失、类型错误和多余文本。通过 JSON Schema、Structured Outputs、代码校验和重试机制，可以把自由文本输出变成可被程序稳定消费的数据接口。

Claude Desktop 接入第三方模型 API：Developer Mode 配置流程与排错

2026-04-25

人工智能 #Claude Desktop #大模型 API #Anthropic API #Developer Mode #第三方推理 #模型聚合

Claude Desktop 可以通过 Developer Mode 配置第三方推理服务，把外部模型 API 接入到客户端里使用。这里讲清它的工作方式、配置步骤、兼容性要求以及常见排错方法。

菜单

归档

2026 年 04 月

Loop Engineering：让 Agent 自己完成开发、验证与迭代

Claude Code 可靠性升级：TUI、流式输出、MCP 与会话自愈机制解析

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

达尔文 Skill 2.0：面向个人开发者的 Agent Skill 自进化优化器

8 个能控制电脑的开源 AI Agent 项目对比

从 Prompt 到 Agent Loop：让 AI Agent 稳定工作的循环设计方法

Step 3.7 Flash 面向 Agent 的高吞吐开源多模态模型上手指南

Claude Fable 5首日实测，杀疯了…

从 Prompt、Context 到 Harness：OpenClaw Agent 架构设计拆解

Agentic Engineering：让 AI Agent 可靠参与软件研发的六条实践