AI 工程核心概念:训练、推理、Transformer 与性能优化

围绕 AI 工程中最常见的训练、推理、Transformer 架构和性能优化手段展开,讲清模型从数据到服务的完整链路,以及并行、量化、蒸馏、缓存等方案分别解决什么问题。

发布于 2025-11-13

CodeWiki 如何用层次化模块拆解生成仓库级代码文档

CodeWiki 的核心思路是把大型代码仓库拆成多层模块,让大语言模型先理解底层代码,再逐层汇总成系统级文档。重点讲清仓库级代码文档生成的难点、层次化模块拆解的工作机制、工程落地流程和常见坑。

发布于 2025-11-12

用 Sora2 制作制造业企业宣传片的分镜与提示词工作流

企业宣传片不能只靠一句“电影级画面”生成,关键在于分镜拆分、视觉风格统一、旁白声线控制和后期拼接。围绕制造业企业宣传片,拆解一套适合 Sora2 的 1 分钟成片制作流程,并给出可直接改写的提示词模板。

发布于 2025-11-07

RAG 检索增强生成:从工作原理到架构优化

RAG 通过“先检索外部知识,再让大语言模型生成回答”的方式缓解幻觉、知识过期和私有数据接入问题。内容覆盖 RAG 的基础架构、常见故障、RAG-Fusion、多路检索、索引优化、安全防护和未来演进方向。

发布于 2025-11-07

用代码执行降低 MCP Agent 的工具调用成本

MCP 让 AI Agent 能连接大量外部工具,但工具定义和中间结果会快速占满上下文窗口。代码执行范式把 MCP 工具封装成代码 API,让 Agent 通过编写代码完成工具组合,从而减少 Token 消耗、降低延迟,并改善大数据处理、隐私保护和状态持久化。

发布于 2025-11-05

RAG 文档分块策略实战:从固定长度到混合分块

RAG 的召回质量很大程度取决于文档如何分块。围绕中文知识库场景,系统讲解固定长度、句子、递归、结构感知、语义、主题、父子段和混合分块的原理、代码实现、适用场景与调参方法。

发布于 2025-10-29

基于 Spring AI Alibaba 构建 Java 版 DeepResearch 的架构与实践

DeepResearch 可以把用户问题拆解为搜索、规划、分析、代码处理、RAG 检索和报告生成等多个步骤。围绕 Spring AI Alibaba Graph 的 Java 实现,讲清整体节点编排、混合 RAG、搜索工具、MCP 扩展、连续对话、报告导出和部署方式。

发布于 2025-10-28

DeepSeek-OCR-WebUI 可视化 OCR 工作台部署与使用指南

DeepSeek-OCR-WebUI 把 OCR 模型封装成可视化工作台,适合处理截图、扫描件、PDF 页面和表格图片。这里从工作流程、核心功能、适用场景、部署方式和常见问题几个角度讲清楚它怎么用、适合解决什么问题。

发布于 2025-10-25

4 个值得收藏的 GitHub 开源项目:Mac 软件清单、React 动效组件、AI 规则和多智能体沙盒

介绍 4 个实用 GitHub 开源项目:Awesome Mac 用来筛选 macOS 软件,React Bits 提供高质量 React 动效组件,Agent Rules 为 Claude Code 和 Cursor 提供工程化规则,Microverse 用 Godot 4 构建多智能体 AI 小镇。

发布于 2025-10-24

从提示词工程到上下文工程:Agent 系统的信息管理方法

上下文工程关注的不再是单条提示词怎么写,而是如何为大语言模型动态组织指令、记忆、工具、检索结果和输出格式。围绕 LangChain、Claude Code、Manus 和 Kiro 的实践,可以看到 Agent 系统从 Prompt 驱动走向 Context 驱动的工程化路径。

发布于 2025-10-24