人工智能 #Claude #Agent #MCP #PTC #Skills #Subagents #工具调用 #上下文工程

Claude Agent 架构：MCP、PTC、Skills 与 Subagents 的分层协同

Claude 的 Agent 能力可以按连接层、认知层和组织层理解：MCP 负责连接外部系统，PTC 用程序批量编排工具调用，Skills 按需注入专业知识，Subagents 把复杂任务拆给多个专门智能体处理。

发布于 2025-12-08

后端 #MCP #Agent #Spring Boot #WebFlux #SSE #JSON-RPC #Function Calling

从零实现一个 Spring Boot MCP Server：协议原理、SSE 通道与工具调用

MCP（模型上下文协议）用于统一 Agent 与外部工具之间的通信。围绕 MCP 的三类角色、SSE 与 JSON-RPC 2.0、初始化握手、工具列表和工具调用流程，使用 Spring Boot WebFlux 实现一个可运行的 MCP Server。

发布于 2025-12-08

人工智能 #Deep Research #AI Agent #RAG #Web Exploration #Report Generation #多源数据融合 #数据分析

Deep Research Agent 架构拆解：从 RAG 到多源数据分析助手

Deep Research 是一种面向复杂研究任务的 AI Agent 范式，它把任务规划、多轮检索、网页探索、证据整合和报告生成串成闭环。围绕 RAG 到 Deep Research 的演进、四大核心模块、评测方法、主流系统局限，以及结构化私域数据与公域信息融合的方案展开讲解。

发布于 2025-11-28

人工智能 #LLM #Agent #Completion #Chat Completion #KV Cache #Prefix Caching #Chat Template

Agent 开发中 Completion 接口与 Chat Completion 的 KV 缓存取舍

Agent 的多轮推理、工具调用和长上下文会反复提交大量相同前缀，KV Cache 复用直接影响延迟和成本。这里从 token 序列、Chat Template 和 Prefix Caching 的角度，讲清 Completion 与 Chat Completion 在控制权上的差异，以及如何设计更容易命中缓存的 Agent Prompt。

发布于 2025-11-27

人工智能 #LangChain #deepagents #LangGraph #Agent #Milvus #向量数据库 #Middleware #长期记忆

用 deepagents 构建长任务 Agent：规划、文件系统、子 Agent 与 Milvus 记忆

deepagents 是 LangChain 面向长周期任务推出的 Agent 框架，核心能力包括任务规划、文件系统访问和子 Agent 委托。通过 CompositeBackend 与 Milvus 结合，可以把临时工作区和跨会话长期记忆分开管理，减少上下文膨胀带来的成本和失控问题。

发布于 2025-11-25

人工智能 #UltraRAG #RAG #MCP #YAML #多模态 #MinerU #VisRAG #PDF解析

UltraRAG：基于 MCP 和 YAML 配置的 RAG 框架实践

UltraRAG 把检索、生成、评估等 RAG 组件封装成独立的 MCP Server，再用 YAML 配置组织 Pipeline。它适合快速搭建可复现的 RAG 实验流程，尤其适合需要处理 PDF、图表、表格和多格式文档的知识问答场景。

发布于 2025-11-19

人工智能 #LangChain #LLM #RAG #Agent #LCEL #向量数据库

LangChain 大模型应用开发框架核心组件详解

LangChain 将提示词、模型调用、输出解析、链式编排、记忆、工具、智能体和检索封装成可组合组件。围绕这些组件讲清大模型应用从简单调用到 RAG 和 Agent 的实现方式、适用场景与常见坑。

发布于 2025-11-19

人工智能 #LLM #Agent #ReAct #Reflexion #Chain-of-Thought #LangChain #Prompt Engineering

ReAct 与 Reflexion：让 LLM Agent 会推理、会行动、会复盘

大语言模型在复杂任务中容易遇到幻觉、信息过期、规划不足和错误传播问题。ReAct 通过“推理 + 行动 + 观察”让模型调用外部工具完成多步任务，Reflexion 再加入评估、反思和记忆，让 Agent 能从失败轨迹中改进下一次尝试。

发布于 2025-11-18

人工智能 #AI 修图 #Transformer #大语言模型 #模型训练 #模型推理 #量化 #KV Cache #模型蒸馏

AI 工程核心概念：训练、推理、Transformer 与性能优化

围绕 AI 工程中最常见的训练、推理、Transformer 架构和性能优化手段展开，讲清模型从数据到服务的完整链路，以及并行、量化、蒸馏、缓存等方案分别解决什么问题。

发布于 2025-11-13

人工智能 #RAG #大语言模型 #向量检索 #RAG-Fusion #Embedding #Prompt 注入 #知识库

RAG 检索增强生成：从工作原理到架构优化

RAG 通过“先检索外部知识，再让大语言模型生成回答”的方式缓解幻觉、知识过期和私有数据接入问题。内容覆盖 RAG 的基础架构、常见故障、RAG-Fusion、多路检索、索引优化、安全防护和未来演进方向。

发布于 2025-11-07