大语言模型默认生成自由文本,难以直接接入业务系统。围绕 Prompt 引导、验证修复、约束解码、监督式微调、强化学习和 API 原生结构化能力,讲清结构化输出的原理、实现方式、评估指标和选型思路。
多智能体框架的差异主要体现在协作抽象、工具调用、状态管理、可观测性和部署能力上。围绕 Swarm、OpenAI Agents SDK、Qwen-Agent、Dify、CrewAI、AutoGen 等 10 个框架,梳理学习、开发、生产三个阶段的选型思路。
后台定时 Agent 能按计划自动采集数据、调用大语言模型分析结果,并在风险场景中触发人工确认。围绕 Spring AI Alibaba 的 StateGraph、CompiledGraph 和 schedule 机制,讲清定时 Agent 的设计方式、代码实现和落地注意事项。
介绍如何让 Claude Code 使用智谱 GLM-4.6 作为编程模型,并通过 MCP 接入视觉理解和联网搜索能力。内容包括 API Key 获取、环境变量配置、MCP 服务配置、测试方法和常见排错。
GraphRAG 把文档切块后抽取实体、关系和声明,构建知识图并用社区检测生成分层摘要,再通过 Map-Reduce 回答面向整个语料库的问题。内容涵盖简单 RAG 的局限、索引流程、查询流程、评估结果和落地注意事项。
PaddleOCR 3.x 不只是文字识别工具,还覆盖多语种 OCR、复杂文档解析、关键信息抽取和服务化部署。围绕 PP-OCRv5、PP-StructureV3、PP-ChatOCRv4,可以构建从图片、PDF 到 Markdown、结构化字段的完整文档处理链路。
WebAssembly 3.0 扩展了内存、类型系统、垃圾回收、异常处理和确定性执行等能力。这里从 asm.js、NaCl 和 Emscripten 讲起,解释 Wasm 为什么能在浏览器和服务端运行,以及在 Web 高性能计算、插件系统、Serverless 和 WASI 场景中的使用边界。
围绕 Claude Code 风格的代码智能体,讲清如何用 LangGraph 从基础 ReAct Agent 扩展出人工确认、检查点恢复、SubAgent、Todo 任务跟踪、上下文压缩和实时中断恢复能力。
AI 编程经常卡在项目上下文不足:代码能写出来,却不符合业务规则、异常规范和团队习惯。私域知识工程通过代码分析、知识库沉淀和文档自动维护,把项目经验结构化地喂给 AI,让代码生成更接近一次可用。