人工智能 #Harness Engineering #Agent #知识库 #上下文工程 #Git #工作流 #LLM Wiki

AI 工程交付中的知识沉淀：Harness 工作流的知识库架构设计

Harness Engineering 的关键不只是编排 Agent 工作流，更要让团队经验持续沉淀成可复用的知识资产。围绕知识分层、Git 化协作、按需检索、生命周期治理和异步人机协作，讲清 AI 工程交付系统该如何设计知识闭环。

发布于 2026-05-11

开源项目 #GitHub #AI Coding #LLM #Agent #3DGS #ComfyUI #Rust

7 个 AI 开发工作流 GitHub 项目：模型路由、Agent 记忆与自动内容生成

围绕 AI Coding 和生成式内容工作流，梳理 9router、jcode、agentmemory、SuperSplat 等 7 个 GitHub 项目的定位、核心机制、适用场景和上手方式，帮助快速判断哪个工具能解决当前问题。

发布于 2026-05-10

人工智能 #Claude Code #Multi-Agent #AI Agent #SubAgent #Prompt Cache #Coordinator #异步消息

Claude Code 多 Agent 机制解析：Subagent、Fork 与 Coordinator

Claude Code 的多 Agent 机制可以拆成常规 Subagent、Fork Subagent 和 Coordinator 三套设计。核心在于工具隔离、上下文隔离、异步消息通信、Prompt 缓存复用以及协调者并行调度。

发布于 2026-05-09

人工智能 #AGI #大语言模型 #Scaling Law #数据中心 #UBI #AI教育 #开源工具

大模型 Scaling 路线的四重边界：能力、能源、供应链与教育应对

大模型通往 AGI 的主流路线面临能力、能源、供应链和分配机制四类边界。围绕 scaling 竞赛、数据中心资源消耗、隐形标注劳动、UBI 方案和 AI 教育工具，梳理普通人理解和应对这一轮 AI 变革的关键问题。

发布于 2026-05-08

人工智能 #OpenAI Codex #Chrome 插件 #浏览器自动化 #AI Agent #Cookie #多标签页 #工作流自动化

Codex Chrome 插件：让 AI Agent 操作已登录浏览器的工作流设计

Codex Chrome 插件让 AI Agent 可以操作用户已经登录的浏览器页面，完成填表、跨网站信息整理、报销提交、多标签页协作等任务。重点讲清它解决的问题、核心机制、典型工作流以及使用时必须注意的安全边界。

发布于 2026-05-08

后端 #Vibe Coding #AI 编程 #Claude Code #Cursor #Token 成本 #上下文工程 #代码审查

Vibe Coding 时代程序员的核心能力：上下文、验证与成本控制

AI 编程工具已经能生成复杂业务代码，程序员的优势不再是简单地说 AI 做不了什么，而是能定义问题、构建上下文、验证结果、做技术决策并控制 Token 成本。

发布于 2026-05-08

人工智能 #RAG #Embedding #向量检索 #文档解析 #Chunking #BM25 #RAGAs

RAG 生产落地的三大难点：文档解析、检索调优与效果评估

RAG 系统跑通 Demo 并不难，难点在于把知识库问答调到生产可用。核心问题集中在文档预处理、检索质量调优和效果评估三层，每一层都会直接影响最终回答质量。

发布于 2026-05-08

人工智能 #AIHOT #Agent #SKILL #RSS #API计费 #AI 新闻 #OpenAPI

AIHOT 的 Skill、RSS 和 API 接入指南：让 Agent 自动追踪 AI 动态

AIHOT 是一个面向 AI 动态的信息聚合服务，支持通过 Skill、RSS 和 API 接入。这里讲清楚三种接入方式分别适合什么场景，以及如何让 Agent 自动获取 AI 日报、精选动态、分类消息和关键词搜索结果。

发布于 2026-05-08

人工智能 #大模型安全 #Claude #红队测试 #Jailbreak #Prompt Injection #社会工程 #AI Agent

Claude 社会工程越狱案例：多轮对话如何击穿大模型安全边界

Mindgard 披露的 Claude 案例显示，关键词过滤不足以覆盖多轮社会工程越狱。内容从攻击链、规范冲突、风险信号和防御方案四个角度，梳理大模型产品应如何做持续红队测试和上下文防护。

发布于 2026-05-08

人工智能 #vLLM #LLM推理 #Prefill #Decode #KV Cache #PagedAttention #Continuous Batching

vLLM 推理全流程详解：Prefill、Decode、PagedAttention 和连续批处理

vLLM 是面向大语言模型推理的高吞吐服务框架。围绕一次请求从进入系统到流式输出的完整路径，讲清 Prefill、Decode、KV Cache、PagedAttention、连续批处理和调度器之间的关系。

发布于 2026-05-07

菜单

作者：芥末

AI 工程交付中的知识沉淀：Harness 工作流的知识库架构设计

7 个 AI 开发工作流 GitHub 项目：模型路由、Agent 记忆与自动内容生成

Claude Code 多 Agent 机制解析：Subagent、Fork 与 Coordinator

大模型 Scaling 路线的四重边界：能力、能源、供应链与教育应对

Codex Chrome 插件：让 AI Agent 操作已登录浏览器的工作流设计

Vibe Coding 时代程序员的核心能力：上下文、验证与成本控制

RAG 生产落地的三大难点：文档解析、检索调优与效果评估

AIHOT 的 Skill、RSS 和 API 接入指南：让 Agent 自动追踪 AI 动态

Claude 社会工程越狱案例：多轮对话如何击穿大模型安全边界

vLLM 推理全流程详解：Prefill、Decode、PagedAttention 和连续批处理

从 Prompt 到 Agent Loop：让 AI Agent 稳定工作的循环设计方法

Loop Engineering：让 Agent 自己完成开发、验证与迭代

8 个能控制电脑的开源 AI Agent 项目对比

Claude Fable 5首日实测，杀疯了…

用 ChatGPT iOS 控制 Codex App：移动端连接多台电脑的配置指南

7 个前端设计 Skill 横评：视觉效果、代码质量与适用场景

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

Fastjson 1.2.83 序列化与反序列化源码机制解析

SDD-RIPER 团队落地指南：用 Spec 和阶段门禁管住大模型编程

Claude Code 的 Prompt、Context 与 Harness 工程设计拆解