用 deepagents 构建长任务 Agent:规划、文件系统、子 Agent 与 Milvus 记忆

deepagents 是 LangChain 面向长周期任务推出的 Agent 框架,核心能力包括任务规划、文件系统访问和子 Agent 委托。通过 CompositeBackend 与 Milvus 结合,可以把临时工作区和跨会话长期记忆分开管理,减少上下文膨胀带来的成本和失控问题。

发布于 2025-11-25

UltraRAG:基于 MCP 和 YAML 配置的 RAG 框架实践

UltraRAG 把检索、生成、评估等 RAG 组件封装成独立的 MCP Server,再用 YAML 配置组织 Pipeline。它适合快速搭建可复现的 RAG 实验流程,尤其适合需要处理 PDF、图表、表格和多格式文档的知识问答场景。

发布于 2025-11-19

LangChain 大模型应用开发框架核心组件详解

LangChain 将提示词、模型调用、输出解析、链式编排、记忆、工具、智能体和检索封装成可组合组件。围绕这些组件讲清大模型应用从简单调用到 RAG 和 Agent 的实现方式、适用场景与常见坑。

发布于 2025-11-19

ReAct 与 Reflexion:让 LLM Agent 会推理、会行动、会复盘

大语言模型在复杂任务中容易遇到幻觉、信息过期、规划不足和错误传播问题。ReAct 通过“推理 + 行动 + 观察”让模型调用外部工具完成多步任务,Reflexion 再加入评估、反思和记忆,让 Agent 能从失败轨迹中改进下一次尝试。

发布于 2025-11-18

AI 工程核心概念:训练、推理、Transformer 与性能优化

围绕 AI 工程中最常见的训练、推理、Transformer 架构和性能优化手段展开,讲清模型从数据到服务的完整链路,以及并行、量化、蒸馏、缓存等方案分别解决什么问题。

发布于 2025-11-13

RAG 检索增强生成:从工作原理到架构优化

RAG 通过“先检索外部知识,再让大语言模型生成回答”的方式缓解幻觉、知识过期和私有数据接入问题。内容覆盖 RAG 的基础架构、常见故障、RAG-Fusion、多路检索、索引优化、安全防护和未来演进方向。

发布于 2025-11-07

用代码执行降低 MCP Agent 的工具调用成本

MCP 让 AI Agent 能连接大量外部工具,但工具定义和中间结果会快速占满上下文窗口。代码执行范式把 MCP 工具封装成代码 API,让 Agent 通过编写代码完成工具组合,从而减少 Token 消耗、降低延迟,并改善大数据处理、隐私保护和状态持久化。

发布于 2025-11-05

RAG 文档分块策略实战:从固定长度到混合分块

RAG 的召回质量很大程度取决于文档如何分块。围绕中文知识库场景,系统讲解固定长度、句子、递归、结构感知、语义、主题、父子段和混合分块的原理、代码实现、适用场景与调参方法。

发布于 2025-10-29

基于 Spring AI Alibaba 构建 Java 版 DeepResearch 的架构与实践

DeepResearch 可以把用户问题拆解为搜索、规划、分析、代码处理、RAG 检索和报告生成等多个步骤。围绕 Spring AI Alibaba Graph 的 Java 实现,讲清整体节点编排、混合 RAG、搜索工具、MCP 扩展、连续对话、报告导出和部署方式。

发布于 2025-10-28

Claude Skills 工作机制:用标准化能力包管理 AI Agent

Claude Skills 将 Agent 完成特定任务所需的指令、脚本、参考资料和素材打包成标准文件夹。内容围绕目录结构、分层加载机制、与 MCP 的关系,以及开发者如何用同样模式管理自研 Agent 能力库展开。

发布于 2025-10-19