TencentDB Agent Memory 为 AI Agent 提供长期记忆和短期记忆能力,让智能体能记住用户事实、偏好和任务上下文。围绕它的核心机制、评测数据、接入方式和落地风险,系统讲清 Agent 记忆模块该怎么设计。
Agent 的可靠性不只取决于模型能力,还取决于模型外部的执行环境、工具协议、上下文管理、编排、可观测性、评估和治理。这里用 ETCLOVG 七层架构系统讲清 Harness Engineering 的设计方法和落地检查项。
Claude Code 用在数仓开发时,常见问题是上下文压缩后遗忘约束、SQL 规范执行不稳定、高 token 操作污染主会话。围绕 Harness、Hooks、Subagents、CLAUDE.md 和 SKILL 改造,可以把 AI 编码从临时对话升级为可验证、可持久化、可隔离的研发流水线。
Agent 架构的核心不是提示词技巧,而是状态、控制流和评估器的设计。围绕 Reflection、Tool Use、ReAct、Planning、PEV、多 Agent、记忆、搜索、模拟和安全闸门等 17 种模式,系统拆解它们解决的问题、拓扑结构、适用场景和工程代价。
AI 编程工具已经能生成复杂业务代码,程序员的优势不再是简单地说 AI 做不了什么,而是能定义问题、构建上下文、验证结果、做技术决策并控制 Token 成本。
RAG 系统跑通 Demo 并不难,难点在于把知识库问答调到生产可用。核心问题集中在文档预处理、检索质量调优和效果评估三层,每一层都会直接影响最终回答质量。
vLLM 是面向大语言模型推理的高吞吐服务框架。围绕一次请求从进入系统到流式输出的完整路径,讲清 Prefill、Decode、KV Cache、PagedAttention、连续批处理和调度器之间的关系。
围绕淘宝闪购 AI 工程岗终面常见问题,系统拆解 RAG、Embedding、相似度计算、Prompt 注入防护、Agent 演进、文件上传、权限过滤和 AI Coding 等核心知识点,帮助把 AI 项目讲得完整、可信、可落地。
围绕 AI 编程、Agent 框架、代码库检索、生产故障排查、安全工具和 GPU 内核优化,梳理 13 个 GitHub 开源项目的核心能力、适用场景和使用限制,帮助快速判断哪些工具适合放进自己的开发工作流。