TencentDB Agent Memory:AI Agent 长短期记忆机制与接入思路

TencentDB Agent Memory 为 AI Agent 提供长期记忆和短期记忆能力,让智能体能记住用户事实、偏好和任务上下文。围绕它的核心机制、评测数据、接入方式和落地风险,系统讲清 Agent 记忆模块该怎么设计。

发布于 2026-06-04

Agent Harness Engineering 七层架构:把大模型变成可靠 Agent 的工程方法

Agent 的可靠性不只取决于模型能力,还取决于模型外部的执行环境、工具协议、上下文管理、编排、可观测性、评估和治理。这里用 ETCLOVG 七层架构系统讲清 Harness Engineering 的设计方法和落地检查项。

发布于 2026-05-25

用 Claude Code Harness 搭建数仓 AI 开发流水线

Claude Code 用在数仓开发时,常见问题是上下文压缩后遗忘约束、SQL 规范执行不稳定、高 token 操作污染主会话。围绕 Harness、Hooks、Subagents、CLAUDE.md 和 SKILL 改造,可以把 AI 编码从临时对话升级为可验证、可持久化、可隔离的研发流水线。

发布于 2026-05-20

17 种 Agent 架构演进:从单次生成到可控执行系统

Agent 架构的核心不是提示词技巧,而是状态、控制流和评估器的设计。围绕 Reflection、Tool Use、ReAct、Planning、PEV、多 Agent、记忆、搜索、模拟和安全闸门等 17 种模式,系统拆解它们解决的问题、拓扑结构、适用场景和工程代价。

发布于 2026-05-18

Vibe Coding 时代程序员的核心能力:上下文、验证与成本控制

AI 编程工具已经能生成复杂业务代码,程序员的优势不再是简单地说 AI 做不了什么,而是能定义问题、构建上下文、验证结果、做技术决策并控制 Token 成本。

发布于 2026-05-08

RAG 生产落地的三大难点:文档解析、检索调优与效果评估

RAG 系统跑通 Demo 并不难,难点在于把知识库问答调到生产可用。核心问题集中在文档预处理、检索质量调优和效果评估三层,每一层都会直接影响最终回答质量。

发布于 2026-05-08

vLLM 推理全流程详解:Prefill、Decode、PagedAttention 和连续批处理

vLLM 是面向大语言模型推理的高吞吐服务框架。围绕一次请求从进入系统到流式输出的完整路径,讲清 Prefill、Decode、KV Cache、PagedAttention、连续批处理和调度器之间的关系。

发布于 2026-05-07

淘宝闪购 AI 工程终面:RAG、Agent、AI Coding 与工程化答题框架

围绕淘宝闪购 AI 工程岗终面常见问题,系统拆解 RAG、Embedding、相似度计算、Prompt 注入防护、Agent 演进、文件上传、权限过滤和 AI Coding 等核心知识点,帮助把 AI 项目讲得完整、可信、可落地。

发布于 2026-05-03

AI Agent 工程架构:从循环控制到上下文、工具、记忆与评测

AI Agent 的稳定性不只取决于模型能力,更取决于循环控制、上下文组织、工具设计、记忆系统、评测体系和安全边界。围绕这些工程要素,可以把 Agent 从一个会调用工具的聊天程序,建设成可验证、可追踪、可恢复的长期运行系统。

发布于 2026-04-28

13 个 GitHub 开源项目:AI 编程、Agent、SRE 与安全工具速览

围绕 AI 编程、Agent 框架、代码库检索、生产故障排查、安全工具和 GPU 内核优化,梳理 13 个 GitHub 开源项目的核心能力、适用场景和使用限制,帮助快速判断哪些工具适合放进自己的开发工作流。

发布于 2026-04-26