人工智能 #AI Agent #MCP #LLM #工具调用 #代码执行 #沙箱

用代码执行降低 MCP Agent 的工具调用成本

MCP 让 AI Agent 能连接大量外部工具，但工具定义和中间结果会快速占满上下文窗口。代码执行范式把 MCP 工具封装成代码 API，让 Agent 通过编写代码完成工具组合，从而减少 Token 消耗、降低延迟，并改善大数据处理、隐私保护和状态持久化。

发布于 2025-11-05

人工智能 #RAG #Chunking #向量检索 #Embedding #LangChain #语义分块

RAG 文档分块策略实战：从固定长度到混合分块

RAG 的召回质量很大程度取决于文档如何分块。围绕中文知识库场景，系统讲解固定长度、句子、递归、结构感知、语义、主题、父子段和混合分块的原理、代码实现、适用场景与调参方法。

发布于 2025-10-29

后端 #Spring AI Alibaba #DeepResearch #RAG #MCP #Multi-Agent #Elasticsearch #Redis #Langfuse

基于 Spring AI Alibaba 构建 Java 版 DeepResearch 的架构与实践

DeepResearch 可以把用户问题拆解为搜索、规划、分析、代码处理、RAG 检索和报告生成等多个步骤。围绕 Spring AI Alibaba Graph 的 Java 实现，讲清整体节点编排、混合 RAG、搜索工具、MCP 扩展、连续对话、报告导出和部署方式。

发布于 2025-10-28

人工智能 #Claude #AI Agent #Skills #MCP #LLM #上下文工程 #Prompt Engineering

Claude Skills 工作机制：用标准化能力包管理 AI Agent

Claude Skills 将 Agent 完成特定任务所需的指令、脚本、参考资料和素材打包成标准文件夹。内容围绕目录结构、分层加载机制、与 MCP 的关系，以及开发者如何用同样模式管理自研 Agent 能力库展开。

发布于 2025-10-19

后端 #Fastjson #JSON #序列化 #反序列化 #ASM #AutoType #流式解析

Fastjson 1.2.83 序列化与反序列化源码机制解析

Fastjson 1.2.83 通过门面 API、序列化器/反序列化器缓存、ASM 字节码生成、词法分析器和安全检查机制完成 Java 对象与 JSON 字符串的双向转换。这里从项目结构、核心调用链、循环引用、AutoType 安全风险和流式解析几个角度讲清它的实现方式。

发布于 2025-10-15

人工智能 #大语言模型 #结构化输出 #JSON Schema #约束解码 #Guardrails #LoRA #强化学习

大语言模型结构化输出：从 Prompt 到约束解码和 Schema 强化学习

大语言模型默认生成自由文本，难以直接接入业务系统。围绕 Prompt 引导、验证修复、约束解码、监督式微调、强化学习和 API 原生结构化能力，讲清结构化输出的原理、实现方式、评估指标和选型思路。

发布于 2025-10-15

人工智能 #AI Agent #Multi-Agent #LLM #RAG #工作流编排 #LLMOps

多智能体 Agent 框架选型：从学习原型到生产落地的 10 个框架

多智能体框架的差异主要体现在协作抽象、工具调用、状态管理、可观测性和部署能力上。围绕 Swarm、OpenAI Agents SDK、Qwen-Agent、Dify、CrewAI、AutoGen 等 10 个框架，梳理学习、开发、生产三个阶段的选型思路。

发布于 2025-10-13

后端 #Spring AI Alibaba #AI Agent #定时任务 #工作流 #人机协同 #Cron #LLM

使用 Spring AI Alibaba 构建后台定时运行的 AI Agent

后台定时 Agent 能按计划自动采集数据、调用大语言模型分析结果，并在风险场景中触发人工确认。围绕 Spring AI Alibaba 的 StateGraph、CompiledGraph 和 schedule 机制，讲清定时 Agent 的设计方式、代码实现和落地注意事项。

发布于 2025-10-11

人工智能 #Claude Code #智谱AI #GLM-4.6 #MCP #API Key #AI编程 #视觉理解 #联网搜索

用 Claude Code 接入智谱 GLM-4.6：API 配置、视觉理解与联网搜索

介绍如何让 Claude Code 使用智谱 GLM-4.6 作为编程模型，并通过 MCP 接入视觉理解和联网搜索能力。内容包括 API Key 获取、环境变量配置、MCP 服务配置、测试方法和常见排错。

发布于 2025-10-10

人工智能 #GraphRAG #RAG #LLM #知识图谱 #查询聚焦摘要 #社区检测 #Leiden算法 #Map-Reduce

GraphRAG：用知识图谱社区摘要回答全局问题

GraphRAG 把文档切块后抽取实体、关系和声明，构建知识图并用社区检测生成分层摘要，再通过 Map-Reduce 回答面向整个语料库的问题。内容涵盖简单 RAG 的局限、索引流程、查询流程、评估结果和落地注意事项。

发布于 2025-09-26

菜单

用代码执行降低 MCP Agent 的工具调用成本

RAG 文档分块策略实战：从固定长度到混合分块

基于 Spring AI Alibaba 构建 Java 版 DeepResearch 的架构与实践

Claude Skills 工作机制：用标准化能力包管理 AI Agent

Fastjson 1.2.83 序列化与反序列化源码机制解析

大语言模型结构化输出：从 Prompt 到约束解码和 Schema 强化学习

多智能体 Agent 框架选型：从学习原型到生产落地的 10 个框架

使用 Spring AI Alibaba 构建后台定时运行的 AI Agent

用 Claude Code 接入智谱 GLM-4.6：API 配置、视觉理解与联网搜索

GraphRAG：用知识图谱社区摘要回答全局问题

从 Prompt 到 Agent Loop：让 AI Agent 稳定工作的循环设计方法

Loop Engineering：让 Agent 自己完成开发、验证与迭代

8 个能控制电脑的开源 AI Agent 项目对比

Claude Fable 5首日实测，杀疯了…

用 ChatGPT iOS 控制 Codex App：移动端连接多台电脑的配置指南

7 个前端设计 Skill 横评：视觉效果、代码质量与适用场景

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

Fastjson 1.2.83 序列化与反序列化源码机制解析

SDD-RIPER 团队落地指南：用 Spec 和阶段门禁管住大模型编程

Claude Code 的 Prompt、Context 与 Harness 工程设计拆解