归档 - 全栈研发笔记

Claude Skills 如何把 AI Agent 从聊天工具推向可复用工作流

2025-12-28

人工智能 #Claude Skills #AI Agent #MCP #AI Coding #工作流 #VLA

Claude Skills 用 Markdown、脚本和资源文件描述任务流程，让大模型在运行时学会“什么时候做、怎么做、用什么工具做”。它和 MCP 一起，把 AI Agent 从单次问答推向可复用、可治理的工作流系统。

7 个覆盖 AI 应用开发链路的 GitHub 开源项目

2025-12-28

人工智能 #Claude Skills #A2UI #Chatterbox #Fabric #LangExtract #Fresh #CocoIndex #数据管道

围绕 AI 应用开发中的能力封装、界面生成、语音合成、提示词工作流、结构化抽取、终端编辑和数据转换，梳理 7 个 GitHub 开源项目的核心思路、适用场景和上手方式。

LLMLingua：微软开源的 Prompt 压缩方案与使用指南

2025-12-28

人工智能 #LLMLingua #Prompt Compression #LLM #RAG #LongLLMLingua #LLMLingua-2 #Prompt Injection

LLMLingua 是微软研究院提出的 Prompt 压缩技术，用小模型或专用分类器在请求进入大模型前删掉冗余 token。它适合 RAG、长对话和长文档问答场景，可降低推理成本、减少延迟，并缓解长上下文中的信息丢失问题。

Waymo Gemini 车载助手系统提示词设计：角色边界、工具调用与安全护栏

2025-12-26

人工智能 #Gemini #Waymo #系统提示词 #工具调用 #车载 AI #安全护栏 #多模态交互

从 Waymo 车载 Gemini 助手的系统提示词设计入手，拆解无人车内 AI 助手如何划分角色边界、调用车内工具、处理失败、保护隐私，并在高风险场景中避免越权控制车辆。

四类 AI 代码 Wiki 工具对比：Qoder Repo Wiki、Code Wiki、Zread 与 DeepWiki-open

2025-12-25

人工智能 #Qoder #Repo Wiki #Code Wiki #Zread #DeepWiki-Open #MCP #Claude Code #代码文档

老项目常见的问题是代码复杂、文档缺失或文档过期。这里围绕 Qoder Repo Wiki、Google Code Wiki、Zread 和 DeepWiki-open 四类 AI 代码 Wiki 工具，讲清它们的能力边界、适用场景、部署方式和选型建议。

Gemini 3 用 JSON 做精准控图：从图片反推描述再局部改图

2025-12-24

人工智能 #Gemini #Prompt工程 #JSON #图像生成 #图像编辑 #多模态

用 Gemini 3 处理图片时，可以先让模型把图片拆成结构化 JSON，再只修改目标字段生成新图。核心思路是把人物、服装、场景、光线、构图等元素拆开管理，减少反复用自然语言解释图片细节的成本。

8 个能控制电脑的开源 AI Agent 项目对比

2025-12-22

人工智能 #AI Agent #GUI Agent #Open Interpreter #Windows UI Automation #VLA #RAG #OSWorld

AI 控制电脑通常有终端执行、截图识别、系统原生接口和端到端视觉动作模型几种路线。围绕 Open Interpreter、Self-Operating Computer、Agent S、UFO、Cradle、OS-Copilot、ShowUI、UI-TARS Desktop，梳理它们的工作方式、适用场景和使用风险。

Agent Skills 开放标准：AI Agent 如何用一个文件夹复用企业能力

2025-12-20

人工智能 #Agent Skills #AI Agent #Claude #MCP #企业 AI #开放标准

Agent Skills 用一个包含说明、脚本和资源的文件夹封装 AI Agent 能力，让能力可以被发现、按需加载并跨平台复用。内容会讲清它的目录结构、渐进式披露机制、与 MCP 的区别，以及企业落地时需要注意的安全和治理问题。

AI 生成代码的真实安全风险：使用趋势、漏洞特征与治理框架

2025-12-19

软件工程 #AI 代码生成 #LLM #软件安全 #CVE #CWE #RAG #RLHF #静态分析

AI 生成代码已经进入真实项目，但功能正确不等于安全可靠。围绕 GitHub 开源项目与 CVE 修复数据，梳理其使用趋势、漏洞类型、攻击面特征，并给出评测、模型增强和人机协同治理方案。

推理模型为什么不再鼓励手动设置 temperature

2025-12-18

人工智能 #LLM #推理模型 #Temperature #解码策略 #Sampling #Looping

推理模型正在弱化甚至限制 temperature 参数，低温采样不再稳定地带来可靠性，反而可能诱发循环输出和性能下降。这里从解码原理、模型现象和工程实践三个角度，讲清 temperature 退场的原因以及代码里该怎么处理。

菜单

归档

2025 年 12 月

Loop Engineering：让 Agent 自己完成开发、验证与迭代

Claude Code 可靠性升级：TUI、流式输出、MCP 与会话自愈机制解析

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

达尔文 Skill 2.0：面向个人开发者的 Agent Skill 自进化优化器

从 Prompt 到 Agent Loop：让 AI Agent 稳定工作的循环设计方法

8 个能控制电脑的开源 AI Agent 项目对比

Step 3.7 Flash 面向 Agent 的高吞吐开源多模态模型上手指南

Claude Fable 5首日实测，杀疯了…

从 Prompt、Context 到 Harness：OpenClaw Agent 架构设计拆解

Agentic Engineering：让 AI Agent 可靠参与软件研发的六条实践