归档

2025 年 12 月

Claude Skills 用 Markdown、脚本和资源文件描述任务流程,让大模型在运行时学会“什么时候做、怎么做、用什么工具做”。它和 MCP 一起,把 AI Agent 从单次问答推向可复用、可治理的工作流系统。
围绕 AI 应用开发中的能力封装、界面生成、语音合成、提示词工作流、结构化抽取、终端编辑和数据转换,梳理 7 个 GitHub 开源项目的核心思路、适用场景和上手方式。
LLMLingua 是微软研究院提出的 Prompt 压缩技术,用小模型或专用分类器在请求进入大模型前删掉冗余 token。它适合 RAG、长对话和长文档问答场景,可降低推理成本、减少延迟,并缓解长上下文中的信息丢失问题。
从 Waymo 车载 Gemini 助手的系统提示词设计入手,拆解无人车内 AI 助手如何划分角色边界、调用车内工具、处理失败、保护隐私,并在高风险场景中避免越权控制车辆。
老项目常见的问题是代码复杂、文档缺失或文档过期。这里围绕 Qoder Repo Wiki、Google Code Wiki、Zread 和 DeepWiki-open 四类 AI 代码 Wiki 工具,讲清它们的能力边界、适用场景、部署方式和选型建议。
用 Gemini 3 处理图片时,可以先让模型把图片拆成结构化 JSON,再只修改目标字段生成新图。核心思路是把人物、服装、场景、光线、构图等元素拆开管理,减少反复用自然语言解释图片细节的成本。
AI 控制电脑通常有终端执行、截图识别、系统原生接口和端到端视觉动作模型几种路线。围绕 Open Interpreter、Self-Operating Computer、Agent S、UFO、Cradle、OS-Copilot、ShowUI、UI-TARS Desktop,梳理它们的工作方式、适用场景和使用风险。
Agent Skills 用一个包含说明、脚本和资源的文件夹封装 AI Agent 能力,让能力可以被发现、按需加载并跨平台复用。内容会讲清它的目录结构、渐进式披露机制、与 MCP 的区别,以及企业落地时需要注意的安全和治理问题。
AI 生成代码已经进入真实项目,但功能正确不等于安全可靠。围绕 GitHub 开源项目与 CVE 修复数据,梳理其使用趋势、漏洞类型、攻击面特征,并给出评测、模型增强和人机协同治理方案。
推理模型正在弱化甚至限制 temperature 参数,低温采样不再稳定地带来可靠性,反而可能诱发循环输出和性能下降。这里从解码原理、模型现象和工程实践三个角度,讲清 temperature 退场的原因以及代码里该怎么处理。