用 JSON Schema 让大模型稳定输出结构化数据

大模型接入业务系统时,单靠“请输出 JSON”很容易出现字段缺失、类型错误和多余文本。通过 JSON Schema、Structured Outputs、代码校验和重试机制,可以把自由文本输出变成可被程序稳定消费的数据接口。

发布于 2026-04-26

RAG 检索优化的四层框架:索引、查询、召回与重排序

RAG 系统的回答质量很大程度取决于检索链路。围绕索引层、查询层、召回层和重排序层,讲清 Parent-Child Chunking、Query 改写、多路召回、RRF 融合和 Rerank 精排的原理、组合方式与取舍。

发布于 2026-04-24

Hermes 与 OpenClaw 技术选型:可写运行时、生态集成与场景边界

Hermes 和 OpenClaw 代表了 AI Agent 的两条路线:前者依靠可写运行时让智能体在使用中积累技能,后者依靠平台集成和多账号管理覆盖复杂运营场景。围绕架构机制、Token 成本、适用场景、微信生态和风险边界进行系统对比,帮助开发者做技术选型。

发布于 2026-04-21

用 Claude Code、Skill 和 MCP 重构后台开发全流程

Vibe Coding 适合快速写原型,但很难直接支撑生产级后台开发。Agentic Engineering 把 AI 放进需求澄清、计划制定、编码、审查、部署和修复的结构化流程里,让开发者负责目标、约束和审核,AI 负责执行可自动化的工程动作。

发布于 2026-04-17

Hermes Agent Skills 闭环系统的设计与实现

Hermes Agent 的 Skills 系统让 Agent 能把复杂任务经验沉淀成可复用技能,并在后续使用中自动检索、加载、修正。这里从 Skill 创建、索引缓存、条件激活、渐进式加载、安全扫描和自改进机制几个角度拆解它的核心设计。

发布于 2026-04-15

RAG 文档切割如何避免语义被截断

RAG 系统做文档切割时,固定长度分块容易把完整语义拆散,导致向量检索召回失败。这里系统讲解重叠切割、语义边界切割、句子窗口检索、父子切割、命题化切割和 Contextual Retrieval 的原理、实现方式与选型取舍。

发布于 2026-04-13

Hermes Agent 的自我进化工作流:Skills、记忆与 MiniMax M2.7 适配

Hermes Agent 是一个可自托管的开源 Agent,核心能力是把任务执行经验沉淀成可复用 Skills,并在后续任务中持续加载和改进。围绕它的学习闭环、持久化记忆、定时任务、多代理并行机制,以及 MiniMax M2.7 这类底层模型在 Agent 场景中的作用进行拆解。

发布于 2026-04-13

SDD-RIPER 团队落地指南:用 Spec 和阶段门禁管住大模型编程

SDD-RIPER 用持久化 Spec、代码索引和审批状态机约束大模型编程,解决上下文腐烂、审查失控、维护断层和代码不可信问题。这里给出团队一周内试点、扩散和治理的完整流程。

发布于 2026-04-09

RAG 中 Rerank 重排序的原理、实现与工程优化

RAG 系统中,向量召回只能快速找到话题相近的候选内容,不能保证文档真正回答问题。围绕 Bi-Encoder、Cross-Encoder、级联检索、阈值过滤和领域微调,讲清 Rerank 如何减少噪声上下文和幻觉回答。

发布于 2026-04-06

用人民币色系做科研图:6 套配色、使用规则与代码模板

人民币纸币的红、绿、棕、蓝、紫、浅绿本身就是一套成熟的视觉系统。这里把这些色系整理成科研绘图可用的调色板,并给出柱状图、折线图、散点图和 R/Python 代码模板。

发布于 2026-04-03