作者:芥末

DeepSeek-V4 的 1M 上下文架构:mHC、CSA/HCA 与训练推理优化

DeepSeek-V4 把上下文窗口扩展到 1M token,同时通过 mHC 残差连接、CSA/HCA 混合稀疏注意力、Muon 优化器、FP4 量化感知训练和 KV Cache 重构解决长上下文带来的计算、显存和训练稳定性问题。

发布于 2026-04-28

Harness Engineering 工程实践:让 AI Agent 稳定交付代码

Harness Engineering 的核心不是把 Prompt 写得更长,而是为 AI Agent 搭建可执行、可验证、可回退的工程环境。内容覆盖多 Agent 协作、Rules/Skills/Scripts 分层、事后验证、测试基线和人类在 AI 编程流程中的职责变化。

发布于 2026-04-28

AI Agent 工程架构:从循环控制到上下文、工具、记忆与评测

AI Agent 的稳定性不只取决于模型能力,更取决于循环控制、上下文组织、工具设计、记忆系统、评测体系和安全边界。围绕这些工程要素,可以把 Agent 从一个会调用工具的聊天程序,建设成可验证、可追踪、可恢复的长期运行系统。

发布于 2026-04-28

code-review-graph:用代码图谱降低 AI 读代码的 Token 成本

code-review-graph 会把代码库预解析为函数、类、调用、依赖组成的结构化图谱,并通过 MCP 提供给 Claude Code 等 AI 编程工具查询。借助影响半径分析和增量索引,它能减少大项目中反复全文读代码带来的 token 浪费。

发布于 2026-04-28

LLM 工作流 Skill 编写指南:结构、触发机制与 6 种设计模式

LLM 工作流 Skill 通过 SKILL.md 把流程、约束、示例和参考资料注入到模型上下文中。内容系统讲解 Skill 的加载机制、frontmatter 写法、6 种常见设计模式,以及可直接改造的模板。

发布于 2026-04-27

13 个 GitHub 开源项目:AI 编程、Agent、SRE 与安全工具速览

围绕 AI 编程、Agent 框架、代码库检索、生产故障排查、安全工具和 GPU 内核优化,梳理 13 个 GitHub 开源项目的核心能力、适用场景和使用限制,帮助快速判断哪些工具适合放进自己的开发工作流。

发布于 2026-04-26

用 JSON Schema 让大模型稳定输出结构化数据

大模型接入业务系统时,单靠“请输出 JSON”很容易出现字段缺失、类型错误和多余文本。通过 JSON Schema、Structured Outputs、代码校验和重试机制,可以把自由文本输出变成可被程序稳定消费的数据接口。

发布于 2026-04-26

Claude Desktop 接入第三方模型 API:Developer Mode 配置流程与排错

Claude Desktop 可以通过 Developer Mode 配置第三方推理服务,把外部模型 API 接入到客户端里使用。这里讲清它的工作方式、配置步骤、兼容性要求以及常见排错方法。

发布于 2026-04-25

RAG 检索优化的四层框架:索引、查询、召回与重排序

RAG 系统的回答质量很大程度取决于检索链路。围绕索引层、查询层、召回层和重排序层,讲清 Parent-Child Chunking、Query 改写、多路召回、RRF 融合和 Rerank 精排的原理、组合方式与取舍。

发布于 2026-04-24

agent-browser:面向 AI Agent 的浏览器自动化 CLI 设计

agent-browser 是一个面向 AI Agent 的浏览器自动化 CLI,它绕过传统“脚本 + CSS 选择器”的模式,直接通过 Chrome DevTools Protocol 操作浏览器,并用可访问性树生成交互快照,让 Agent 可以基于短引用完成点击、输入等动作。

发布于 2026-04-23