Claude Code 多 Agent 机制解析:Subagent、Fork 与 Coordinator

Claude Code 的多 Agent 机制可以拆成常规 Subagent、Fork Subagent 和 Coordinator 三套设计。核心在于工具隔离、上下文隔离、异步消息通信、Prompt 缓存复用以及协调者并行调度。

发布于 2026-05-09

大模型 Scaling 路线的四重边界:能力、能源、供应链与教育应对

大模型通往 AGI 的主流路线面临能力、能源、供应链和分配机制四类边界。围绕 scaling 竞赛、数据中心资源消耗、隐形标注劳动、UBI 方案和 AI 教育工具,梳理普通人理解和应对这一轮 AI 变革的关键问题。

发布于 2026-05-08

Codex Chrome 插件:让 AI Agent 操作已登录浏览器的工作流设计

Codex Chrome 插件让 AI Agent 可以操作用户已经登录的浏览器页面,完成填表、跨网站信息整理、报销提交、多标签页协作等任务。重点讲清它解决的问题、核心机制、典型工作流以及使用时必须注意的安全边界。

发布于 2026-05-08

Vibe Coding 时代程序员的核心能力:上下文、验证与成本控制

AI 编程工具已经能生成复杂业务代码,程序员的优势不再是简单地说 AI 做不了什么,而是能定义问题、构建上下文、验证结果、做技术决策并控制 Token 成本。

发布于 2026-05-08

RAG 生产落地的三大难点:文档解析、检索调优与效果评估

RAG 系统跑通 Demo 并不难,难点在于把知识库问答调到生产可用。核心问题集中在文档预处理、检索质量调优和效果评估三层,每一层都会直接影响最终回答质量。

发布于 2026-05-08

AIHOT 的 Skill、RSS 和 API 接入指南:让 Agent 自动追踪 AI 动态

AIHOT 是一个面向 AI 动态的信息聚合服务,支持通过 Skill、RSS 和 API 接入。这里讲清楚三种接入方式分别适合什么场景,以及如何让 Agent 自动获取 AI 日报、精选动态、分类消息和关键词搜索结果。

发布于 2026-05-08

Claude 社会工程越狱案例:多轮对话如何击穿大模型安全边界

Mindgard 披露的 Claude 案例显示,关键词过滤不足以覆盖多轮社会工程越狱。内容从攻击链、规范冲突、风险信号和防御方案四个角度,梳理大模型产品应如何做持续红队测试和上下文防护。

发布于 2026-05-08

vLLM 推理全流程详解:Prefill、Decode、PagedAttention 和连续批处理

vLLM 是面向大语言模型推理的高吞吐服务框架。围绕一次请求从进入系统到流式输出的完整路径,讲清 Prefill、Decode、KV Cache、PagedAttention、连续批处理和调度器之间的关系。

发布于 2026-05-07

用 CLAUDE.md 约束 Claude Code 的四条工程规则

CLAUDE.md 是 Claude Code 的项目级指令文件,可以在每次会话开始时给 AI 编程代理设定行为边界。围绕少假设、少过度设计、少无关修改、用验证目标驱动执行四个方向,可以明显减少 AI 写代码时常见的失控问题。

发布于 2026-05-04

Warp 开源后的关键设计:Block 终端为什么更适合 AI Agent

Warp 开源后,真正值得关注的不是界面变漂亮,而是它把传统终端的纯文本流改造成了结构化 Block。Block 让命令、输出、错误、目录和退出码形成完整上下文,更适合大语言模型理解、诊断和执行修复动作。

发布于 2026-05-04