归档

2025 年 11 月

LangChain 大模型应用开发框架核心组件详解

2025-11-19

人工智能 #LangChain #LLM #RAG #Agent #LCEL #向量数据库

LangChain 将提示词、模型调用、输出解析、链式编排、记忆、工具、智能体和检索封装成可组合组件。围绕这些组件讲清大模型应用从简单调用到 RAG 和 Agent 的实现方式、适用场景与常见坑。

ReAct 与 Reflexion：让 LLM Agent 会推理、会行动、会复盘

2025-11-18

人工智能 #LLM #Agent #ReAct #Reflexion #Chain-of-Thought #LangChain #Prompt Engineering

大语言模型在复杂任务中容易遇到幻觉、信息过期、规划不足和错误传播问题。ReAct 通过“推理 + 行动 + 观察”让模型调用外部工具完成多步任务，Reflexion 再加入评估、反思和记忆，让 Agent 能从失败轨迹中改进下一次尝试。

AI 工程核心概念：训练、推理、Transformer 与性能优化

2025-11-13

人工智能 #AI 修图 #Transformer #大语言模型 #模型训练 #模型推理 #量化 #KV Cache #模型蒸馏

围绕 AI 工程中最常见的训练、推理、Transformer 架构和性能优化手段展开，讲清模型从数据到服务的完整链路，以及并行、量化、蒸馏、缓存等方案分别解决什么问题。

CodeWiki 如何用层次化模块拆解生成仓库级代码文档

2025-11-12

软件工程 #CodeWiki #LLM #代码文档 #层次化模块拆解 #代码理解 #仓库级文档

CodeWiki 的核心思路是把大型代码仓库拆成多层模块，让大语言模型先理解底层代码，再逐层汇总成系统级文档。重点讲清仓库级代码文档生成的难点、层次化模块拆解的工作机制、工程落地流程和常见坑。

用 Sora2 制作制造业企业宣传片的分镜与提示词工作流

2025-11-07

人工智能 #Sora2 #AI视频 #企业宣传片 #提示词 #分镜脚本 #旁白一致性 #剪辑

企业宣传片不能只靠一句“电影级画面”生成，关键在于分镜拆分、视觉风格统一、旁白声线控制和后期拼接。围绕制造业企业宣传片，拆解一套适合 Sora2 的 1 分钟成片制作流程，并给出可直接改写的提示词模板。

RAG 检索增强生成：从工作原理到架构优化

2025-11-07

人工智能 #RAG #大语言模型 #向量检索 #RAG-Fusion #Embedding #Prompt 注入 #知识库

RAG 通过“先检索外部知识，再让大语言模型生成回答”的方式缓解幻觉、知识过期和私有数据接入问题。内容覆盖 RAG 的基础架构、常见故障、RAG-Fusion、多路检索、索引优化、安全防护和未来演进方向。

用代码执行降低 MCP Agent 的工具调用成本

2025-11-05

人工智能 #AI Agent #MCP #LLM #工具调用 #代码执行 #沙箱

MCP 让 AI Agent 能连接大量外部工具，但工具定义和中间结果会快速占满上下文窗口。代码执行范式把 MCP 工具封装成代码 API，让 Agent 通过编写代码完成工具组合，从而减少 Token 消耗、降低延迟，并改善大数据处理、隐私保护和状态持久化。

2025 年 10 月

RAG 文档分块策略实战：从固定长度到混合分块

2025-10-29

人工智能 #RAG #Chunking #向量检索 #Embedding #LangChain #语义分块

RAG 的召回质量很大程度取决于文档如何分块。围绕中文知识库场景，系统讲解固定长度、句子、递归、结构感知、语义、主题、父子段和混合分块的原理、代码实现、适用场景与调参方法。

基于 Spring AI Alibaba 构建 Java 版 DeepResearch 的架构与实践

2025-10-28

后端 #Spring AI Alibaba #DeepResearch #RAG #MCP #Multi-Agent #Elasticsearch #Redis #Langfuse

DeepResearch 可以把用户问题拆解为搜索、规划、分析、代码处理、RAG 检索和报告生成等多个步骤。围绕 Spring AI Alibaba Graph 的 Java 实现，讲清整体节点编排、混合 RAG、搜索工具、MCP 扩展、连续对话、报告导出和部署方式。

DeepSeek-OCR-WebUI 可视化 OCR 工作台部署与使用指南

2025-10-25

人工智能 #DeepSeek-OCR #OCR #WebUI #文档识别 #图像识别 #Gradio

DeepSeek-OCR-WebUI 把 OCR 模型封装成可视化工作台，适合处理截图、扫描件、PDF 页面和表格图片。这里从工作流程、核心功能、适用场景、部署方式和常见问题几个角度讲清楚它怎么用、适合解决什么问题。

菜单

归档

2025 年 11 月

2025 年 10 月

Loop Engineering：让 Agent 自己完成开发、验证与迭代

Claude Code 可靠性升级：TUI、流式输出、MCP 与会话自愈机制解析

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

达尔文 Skill 2.0：面向个人开发者的 Agent Skill 自进化优化器

8 个能控制电脑的开源 AI Agent 项目对比

从 Prompt 到 Agent Loop：让 AI Agent 稳定工作的循环设计方法

Step 3.7 Flash 面向 Agent 的高吞吐开源多模态模型上手指南

Claude Fable 5首日实测，杀疯了…

从 Prompt、Context 到 Harness：OpenClaw Agent 架构设计拆解

Agentic Engineering：让 AI Agent 可靠参与软件研发的六条实践