人工智能 #RAG #Agent #Embedding #Prompt Engineering #AI Coding #向量检索 #权限控制 #断点续传

淘宝闪购 AI 工程终面：RAG、Agent、AI Coding 与工程化答题框架

围绕淘宝闪购 AI 工程岗终面常见问题，系统拆解 RAG、Embedding、相似度计算、Prompt 注入防护、Agent 演进、文件上传、权限过滤和 AI Coding 等核心知识点，帮助把 AI 项目讲得完整、可信、可落地。

发布于 2026-05-03

人工智能 #AI Agent #LLM #上下文工程 #工具调用 #记忆系统 #多 Agent #Agent 评测 #可观测性

AI Agent 工程架构：从循环控制到上下文、工具、记忆与评测

AI Agent 的稳定性不只取决于模型能力，更取决于循环控制、上下文组织、工具设计、记忆系统、评测体系和安全边界。围绕这些工程要素，可以把 Agent 从一个会调用工具的聊天程序，建设成可验证、可追踪、可恢复的长期运行系统。

发布于 2026-04-28

开源项目 #GitHub #AI Agent #Claude Code #OpenAI Agents SDK #MCP #SRE #安全工具 #CUDA

13 个 GitHub 开源项目：AI 编程、Agent、SRE 与安全工具速览

围绕 AI 编程、Agent 框架、代码库检索、生产故障排查、安全工具和 GPU 内核优化，梳理 13 个 GitHub 开源项目的核心能力、适用场景和使用限制，帮助快速判断哪些工具适合放进自己的开发工作流。

发布于 2026-04-26

人工智能 #大模型 #JSON Schema #Structured Outputs #Function Calling #Pydantic #jsonschema #API 集成

用 JSON Schema 让大模型稳定输出结构化数据

大模型接入业务系统时，单靠“请输出 JSON”很容易出现字段缺失、类型错误和多余文本。通过 JSON Schema、Structured Outputs、代码校验和重试机制，可以把自由文本输出变成可被程序稳定消费的数据接口。

发布于 2026-04-26

人工智能 #RAG #向量检索 #Embedding #Rerank #BM25 #RRF #HyDE

RAG 检索优化的四层框架：索引、查询、召回与重排序

RAG 系统的回答质量很大程度取决于检索链路。围绕索引层、查询层、召回层和重排序层，讲清 Parent-Child Chunking、Query 改写、多路召回、RRF 融合和 Rerank 精排的原理、组合方式与取舍。

发布于 2026-04-24

人工智能 #AI Agent #Hermes #OpenClaw #可写运行时 #技能库 #Token 成本 #微信 Bot

Hermes 与 OpenClaw 技术选型：可写运行时、生态集成与场景边界

Hermes 和 OpenClaw 代表了 AI Agent 的两条路线：前者依靠可写运行时让智能体在使用中积累技能，后者依靠平台集成和多账号管理覆盖复杂运营场景。围绕架构机制、Token 成本、适用场景、微信生态和风险边界进行系统对比，帮助开发者做技术选型。

发布于 2026-04-21

后端 #Claude Code #Agentic Engineering #MCP #SKILL #Command #DevOps #Code Review #Git Workflow

用 Claude Code、Skill 和 MCP 重构后台开发全流程

Vibe Coding 适合快速写原型，但很难直接支撑生产级后台开发。Agentic Engineering 把 AI 放进需求澄清、计划制定、编码、审查、部署和修复的结构化流程里，让开发者负责目标、约束和审核，AI 负责执行可自动化的工程动作。

发布于 2026-04-17

人工智能 #AI Agent #Hermes Agent #LLM #Skills #Prompt Cache #Prompt Injection #Agent Memory

Hermes Agent Skills 闭环系统的设计与实现

Hermes Agent 的 Skills 系统让 Agent 能把复杂任务经验沉淀成可复用技能，并在后续使用中自动检索、加载、修正。这里从 Skill 创建、索引缓存、条件激活、渐进式加载、安全扫描和自改进机制几个角度拆解它的核心设计。

发布于 2026-04-15

人工智能 #RAG #Chunking #Embedding #向量检索 #句子窗口检索 #父子切割 #Contextual Retrieval

RAG 文档切割如何避免语义被截断

RAG 文档切割如果把完整语义拆散，向量检索可能召回不到真正答案。围绕重叠切割、语义边界切割、句子窗口检索、父子切割、命题化切割和 Contextual Retrieval，讲清语义截断的成因、解决思路和工程取舍。

发布于 2026-04-13

人工智能 #RAG #Chunking #向量检索 #Embedding #BM25 #Contextual Retrieval

RAG 文档切割如何避免语义被截断

RAG 系统做文档切割时，固定长度分块容易把完整语义拆散，导致向量检索召回失败。这里系统讲解重叠切割、语义边界切割、句子窗口检索、父子切割、命题化切割和 Contextual Retrieval 的原理、实现方式与选型取舍。

发布于 2026-04-13

菜单

淘宝闪购 AI 工程终面：RAG、Agent、AI Coding 与工程化答题框架

AI Agent 工程架构：从循环控制到上下文、工具、记忆与评测

13 个 GitHub 开源项目：AI 编程、Agent、SRE 与安全工具速览

用 JSON Schema 让大模型稳定输出结构化数据

RAG 检索优化的四层框架：索引、查询、召回与重排序

Hermes 与 OpenClaw 技术选型：可写运行时、生态集成与场景边界

用 Claude Code、Skill 和 MCP 重构后台开发全流程

Hermes Agent Skills 闭环系统的设计与实现

RAG 文档切割如何避免语义被截断

RAG 文档切割如何避免语义被截断

从 Prompt 到 Agent Loop：让 AI Agent 稳定工作的循环设计方法

Loop Engineering：让 Agent 自己完成开发、验证与迭代

8 个能控制电脑的开源 AI Agent 项目对比

Claude Fable 5首日实测，杀疯了…

用 ChatGPT iOS 控制 Codex App：移动端连接多台电脑的配置指南

7 个前端设计 Skill 横评：视觉效果、代码质量与适用场景

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

Fastjson 1.2.83 序列化与反序列化源码机制解析

SDD-RIPER 团队落地指南：用 Spec 和阶段门禁管住大模型编程

Claude Code 的 Prompt、Context 与 Harness 工程设计拆解