人工智能 #RAG #Chunking #向量检索 #Embedding #LangChain #语义分块

RAG 文档分块策略实战：从固定长度到混合分块

RAG 的召回质量很大程度取决于文档如何分块。围绕中文知识库场景，系统讲解固定长度、句子、递归、结构感知、语义、主题、父子段和混合分块的原理、代码实现、适用场景与调参方法。

发布于 2025-10-29

后端 #Spring AI Alibaba #DeepResearch #RAG #MCP #Multi-Agent #Elasticsearch #Redis #Langfuse

基于 Spring AI Alibaba 构建 Java 版 DeepResearch 的架构与实践

DeepResearch 可以把用户问题拆解为搜索、规划、分析、代码处理、RAG 检索和报告生成等多个步骤。围绕 Spring AI Alibaba Graph 的 Java 实现，讲清整体节点编排、混合 RAG、搜索工具、MCP 扩展、连续对话、报告导出和部署方式。

发布于 2025-10-28

人工智能 #DeepSeek-OCR #OCR #WebUI #文档识别 #图像识别 #Gradio

DeepSeek-OCR-WebUI 可视化 OCR 工作台部署与使用指南

DeepSeek-OCR-WebUI 把 OCR 模型封装成可视化工作台，适合处理截图、扫描件、PDF 页面和表格图片。这里从工作流程、核心功能、适用场景、部署方式和常见问题几个角度讲清楚它怎么用、适合解决什么问题。

发布于 2025-10-25

开源项目 #GitHub #macOS #ReAct #UI组件 #Claude Code #Cursor #MCP #Godot

4 个值得收藏的 GitHub 开源项目：Mac 软件清单、React 动效组件、AI 规则和多智能体沙盒

介绍 4 个实用 GitHub 开源项目：Awesome Mac 用来筛选 macOS 软件，React Bits 提供高质量 React 动效组件，Agent Rules 为 Claude Code 和 Cursor 提供工程化规则，Microverse 用 Godot 4 构建多智能体 AI 小镇。

发布于 2025-10-24

人工智能 #LLM #AI Agent #上下文工程 #RAG #Claude Code #Manus #Spec-Driven Development

从提示词工程到上下文工程：Agent 系统的信息管理方法

上下文工程关注的不再是单条提示词怎么写，而是如何为大语言模型动态组织指令、记忆、工具、检索结果和输出格式。围绕 LangChain、Claude Code、Manus 和 Kiro 的实践，可以看到 Agent 系统从 Prompt 驱动走向 Context 驱动的工程化路径。

发布于 2025-10-24

人工智能 #Seed3D #3D生成 #Diffusion Transformer #PBR材质 #Isaac Sim #世界模型

Seed3D 1.0 如何从单张图像生成仿真级 3D 资产

Seed3D 1.0 是字节跳动 Seed 团队推出的单图生成 3D 模型系统，可以从一张参考图生成几何结构、纹理贴图和 PBR 材质。围绕数据管线、模型架构、评估结果和具身智能场景，系统讲清它如何把 2D 图像转成可用于仿真的 3D 资产。

发布于 2025-10-23

人工智能 #Claude #AI Agent #Skills #MCP #LLM #上下文工程 #Prompt Engineering

Claude Skills 工作机制：用标准化能力包管理 AI Agent

Claude Skills 将 Agent 完成特定任务所需的指令、脚本、参考资料和素材打包成标准文件夹。内容围绕目录结构、分层加载机制、与 MCP 的关系，以及开发者如何用同样模式管理自研 Agent 能力库展开。

发布于 2025-10-19

人工智能 #LLM #AI Agent #Vibe Coding #Prompt Engineering #Context Engineering #人机协同 #软件可靠性

Vibe Coding 的可靠性边界：从 LLM 概率本质到 AI 协同工程

LLM 不是确定性的开发者，而是基于上下文预测 Token 的概率模型。围绕 p^n 成功率衰减、上下文舒适区、Unknown Unknown 错误和责任边界，讲清如何设计更可靠的人机协同开发流程。

发布于 2025-10-15

人工智能 #大语言模型 #结构化输出 #JSON Schema #约束解码 #Guardrails #LoRA #强化学习

大语言模型结构化输出：从 Prompt 到约束解码和 Schema 强化学习

大语言模型默认生成自由文本，难以直接接入业务系统。围绕 Prompt 引导、验证修复、约束解码、监督式微调、强化学习和 API 原生结构化能力，讲清结构化输出的原理、实现方式、评估指标和选型思路。

发布于 2025-10-15

人工智能 #AI Agent #Multi-Agent #LLM #RAG #工作流编排 #LLMOps

多智能体 Agent 框架选型：从学习原型到生产落地的 10 个框架

多智能体框架的差异主要体现在协作抽象、工具调用、状态管理、可观测性和部署能力上。围绕 Swarm、OpenAI Agents SDK、Qwen-Agent、Dify、CrewAI、AutoGen 等 10 个框架，梳理学习、开发、生产三个阶段的选型思路。

发布于 2025-10-13

菜单

RAG 文档分块策略实战：从固定长度到混合分块

基于 Spring AI Alibaba 构建 Java 版 DeepResearch 的架构与实践

DeepSeek-OCR-WebUI 可视化 OCR 工作台部署与使用指南

4 个值得收藏的 GitHub 开源项目：Mac 软件清单、React 动效组件、AI 规则和多智能体沙盒

从提示词工程到上下文工程：Agent 系统的信息管理方法

Seed3D 1.0 如何从单张图像生成仿真级 3D 资产

Claude Skills 工作机制：用标准化能力包管理 AI Agent

Vibe Coding 的可靠性边界：从 LLM 概率本质到 AI 协同工程

大语言模型结构化输出：从 Prompt 到约束解码和 Schema 强化学习

多智能体 Agent 框架选型：从学习原型到生产落地的 10 个框架

Loop Engineering：让 Agent 自己完成开发、验证与迭代

从 Prompt 到 Agent Loop：让 AI Agent 稳定工作的循环设计方法

8 个能控制电脑的开源 AI Agent 项目对比

Claude Fable 5首日实测，杀疯了…

用 ChatGPT iOS 控制 Codex App：移动端连接多台电脑的配置指南

7 个前端设计 Skill 横评：视觉效果、代码质量与适用场景

Fastjson 1.2.83 序列化与反序列化源码机制解析

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

SDD-RIPER 团队落地指南：用 Spec 和阶段门禁管住大模型编程

Claude Code 的 Prompt、Context 与 Harness 工程设计拆解