大语言模型训练为什么像玄学:梯度下降、Loss 曲线与 RLHF

大语言模型训练常被称为玄学,是因为参数规模巨大、可观测信号有限,超参数、数据配方和训练目标互相耦合。这里从预训练、微调、RLHF 三个阶段讲起,解释梯度下降、反向传播、Loss 曲线以及训练中常见的失控模式。

发布于 2025-12-29

Claude Skills 如何把 AI Agent 从聊天工具推向可复用工作流

Claude Skills 用 Markdown、脚本和资源文件描述任务流程,让大模型在运行时学会“什么时候做、怎么做、用什么工具做”。它和 MCP 一起,把 AI Agent 从单次问答推向可复用、可治理的工作流系统。

发布于 2025-12-28

7 个覆盖 AI 应用开发链路的 GitHub 开源项目

围绕 AI 应用开发中的能力封装、界面生成、语音合成、提示词工作流、结构化抽取、终端编辑和数据转换,梳理 7 个 GitHub 开源项目的核心思路、适用场景和上手方式。

发布于 2025-12-28

LLMLingua:微软开源的 Prompt 压缩方案与使用指南

LLMLingua 是微软研究院提出的 Prompt 压缩技术,用小模型或专用分类器在请求进入大模型前删掉冗余 token。它适合 RAG、长对话和长文档问答场景,可降低推理成本、减少延迟,并缓解长上下文中的信息丢失问题。

发布于 2025-12-28

Waymo Gemini 车载助手系统提示词设计:角色边界、工具调用与安全护栏

从 Waymo 车载 Gemini 助手的系统提示词设计入手,拆解无人车内 AI 助手如何划分角色边界、调用车内工具、处理失败、保护隐私,并在高风险场景中避免越权控制车辆。

发布于 2025-12-26

四类 AI 代码 Wiki 工具对比:Qoder Repo Wiki、Code Wiki、Zread 与 DeepWiki-open

老项目常见的问题是代码复杂、文档缺失或文档过期。这里围绕 Qoder Repo Wiki、Google Code Wiki、Zread 和 DeepWiki-open 四类 AI 代码 Wiki 工具,讲清它们的能力边界、适用场景、部署方式和选型建议。

发布于 2025-12-25

Gemini 3 用 JSON 做精准控图:从图片反推描述再局部改图

用 Gemini 3 处理图片时,可以先让模型把图片拆成结构化 JSON,再只修改目标字段生成新图。核心思路是把人物、服装、场景、光线、构图等元素拆开管理,减少反复用自然语言解释图片细节的成本。

发布于 2025-12-24

8 个能控制电脑的开源 AI Agent 项目对比

AI 控制电脑通常有终端执行、截图识别、系统原生接口和端到端视觉动作模型几种路线。围绕 Open Interpreter、Self-Operating Computer、Agent S、UFO、Cradle、OS-Copilot、ShowUI、UI-TARS Desktop,梳理它们的工作方式、适用场景和使用风险。

发布于 2025-12-22

Agent Skills 开放标准:AI Agent 如何用一个文件夹复用企业能力

Agent Skills 用一个包含说明、脚本和资源的文件夹封装 AI Agent 能力,让能力可以被发现、按需加载并跨平台复用。内容会讲清它的目录结构、渐进式披露机制、与 MCP 的区别,以及企业落地时需要注意的安全和治理问题。

发布于 2025-12-20

AI 生成代码的真实安全风险:使用趋势、漏洞特征与治理框架

AI 生成代码已经进入真实项目,但功能正确不等于安全可靠。围绕 GitHub 开源项目与 CVE 修复数据,梳理其使用趋势、漏洞类型、攻击面特征,并给出评测、模型增强和人机协同治理方案。

发布于 2025-12-19