后端 #AI Agent #AI Coding #微服务 #架构治理 #Harness #可观测性 #CI/CD #权限控制

面向 AI Agent 的后端架构改造：从系统事实到无人值守开发

后端系统要让 AI Agent 安全参与开发、排障和发布，关键是把架构、服务、领域、接口、数据和运行态知识结构化，并用 Harness、测试、权限和 CI/CD 把自动化变成可验证流程。

发布于 2026-06-15

人工智能 #RAG #Agent #知识库 #知识图谱 #GraphRAG #LLM Wiki #检索增强生成 #上下文工程

面向 Agent 的分层知识库设计：从 RAG 到 Knowledge Context Layer

RAG 能解决知识召回问题，但在工程知识库里容易遇到粒度混乱、缺少关联、无法积累等问题。分层知识库把原则、架构、规范、实现和经验拆成不同层级，再结合图谱关系和角色路由，为 Agent 提供更稳定、更可控的 Knowledge Context Layer。

发布于 2026-06-10

人工智能 #TencentDB #AI Agent #Agent Memory #LLM #长期记忆 #短期记忆 #RAG

TencentDB Agent Memory：AI Agent 长短期记忆机制与接入思路

TencentDB Agent Memory 为 AI Agent 提供长期记忆和短期记忆能力，让智能体能记住用户事实、偏好和任务上下文。围绕它的核心机制、评测数据、接入方式和落地风险，系统讲清 Agent 记忆模块该怎么设计。

发布于 2026-06-04

后端 #高并发 #分布式存储 #Redis #MySQL #PaxosStore #分库分表 #逻辑清零

10 亿用户零点步数清零的高并发架构设计

以微信步数零点清零和排行榜结算为例，讲清 10 亿级用户系统如何避免全表更新、如何用时间版本号实现逻辑清零、如何处理时钟漂移、排行榜 BigKey 和冷数据归档问题。

发布于 2026-05-28

人工智能 #LLM #Agent #Harness Engineering #MCP #沙箱 #可观测性 #评估 #安全治理

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

Agent 的可靠性不只取决于模型能力，还取决于模型外部的执行环境、工具协议、上下文管理、编排、可观测性、评估和治理。这里用 ETCLOVG 七层架构系统讲清 Harness Engineering 的设计方法和落地检查项。

发布于 2026-05-25

后端 #Claude Code #Harness #Hooks #Subagents #数仓 #Context Compact #SQL 规范 #CLAUDE.md

用 Claude Code Harness 搭建数仓 AI 开发流水线

Claude Code 用在数仓开发时，常见问题是上下文压缩后遗忘约束、SQL 规范执行不稳定、高 token 操作污染主会话。围绕 Harness、Hooks、Subagents、CLAUDE.md 和 SKILL 改造，可以把 AI 编码从临时对话升级为可验证、可持久化、可隔离的研发流水线。

发布于 2026-05-20

人工智能 #Agent #LLM #agno #ReAct #Multi-Agent #Workflow #Tree-of-Thoughts #Memory

17 种 Agent 架构演进：从单次生成到可控执行系统

Agent 架构的核心不是提示词技巧，而是状态、控制流和评估器的设计。围绕 Reflection、Tool Use、ReAct、Planning、PEV、多 Agent、记忆、搜索、模拟和安全闸门等 17 种模式，系统拆解它们解决的问题、拓扑结构、适用场景和工程代价。

发布于 2026-05-18

后端 #Vibe Coding #AI 编程 #Claude Code #Cursor #Token 成本 #上下文工程 #代码审查

Vibe Coding 时代程序员的核心能力：上下文、验证与成本控制

AI 编程工具已经能生成复杂业务代码，程序员的优势不再是简单地说 AI 做不了什么，而是能定义问题、构建上下文、验证结果、做技术决策并控制 Token 成本。

发布于 2026-05-08

人工智能 #RAG #Embedding #向量检索 #文档解析 #Chunking #BM25 #RAGAs

RAG 生产落地的三大难点：文档解析、检索调优与效果评估

RAG 系统跑通 Demo 并不难，难点在于把知识库问答调到生产可用。核心问题集中在文档预处理、检索质量调优和效果评估三层，每一层都会直接影响最终回答质量。

发布于 2026-05-08

人工智能 #vLLM #LLM推理 #Prefill #Decode #KV Cache #PagedAttention #Continuous Batching

vLLM 推理全流程详解：Prefill、Decode、PagedAttention 和连续批处理

vLLM 是面向大语言模型推理的高吞吐服务框架。围绕一次请求从进入系统到流式输出的完整路径，讲清 Prefill、Decode、KV Cache、PagedAttention、连续批处理和调度器之间的关系。

发布于 2026-05-07

菜单

面向 AI Agent 的后端架构改造：从系统事实到无人值守开发

面向 Agent 的分层知识库设计：从 RAG 到 Knowledge Context Layer

TencentDB Agent Memory：AI Agent 长短期记忆机制与接入思路

10 亿用户零点步数清零的高并发架构设计

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

用 Claude Code Harness 搭建数仓 AI 开发流水线

17 种 Agent 架构演进：从单次生成到可控执行系统

Vibe Coding 时代程序员的核心能力：上下文、验证与成本控制

RAG 生产落地的三大难点：文档解析、检索调优与效果评估

vLLM 推理全流程详解：Prefill、Decode、PagedAttention 和连续批处理

从 Prompt 到 Agent Loop：让 AI Agent 稳定工作的循环设计方法

Loop Engineering：让 Agent 自己完成开发、验证与迭代

8 个能控制电脑的开源 AI Agent 项目对比

Claude Fable 5首日实测，杀疯了…

用 ChatGPT iOS 控制 Codex App：移动端连接多台电脑的配置指南

7 个前端设计 Skill 横评：视觉效果、代码质量与适用场景

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

Fastjson 1.2.83 序列化与反序列化源码机制解析

SDD-RIPER 团队落地指南：用 Spec 和阶段门禁管住大模型编程

Claude Code 的 Prompt、Context 与 Harness 工程设计拆解