AI(人工智能)编程助手里的 Skill(技能包),可以理解成一套“可被助手调用的工作流”。它通常不只是几句提示词,而是把说明文件、脚本、依赖工具、调用约定放在一个目录里,让助手在特定任务中按规则执行。
普通提示词更像一次性指令,Skill 更像可复用插件。比如视频剪辑任务里,助手可以先调用 Whisper 识别字幕,再根据规则找到口误和静音片段,最后用 FFmpeg 执行剪切。用户不需要每次把完整流程重新描述一遍,只要触发对应 Skill 即可。
flowchart LR
A[用户输入任务] --> B[AI 助手识别意图]
B --> C[匹配本地 Skill]
C --> D[读取 Skill 规则]
D --> E[调用脚本或外部工具]
E --> F[生成处理结果]
F --> G[返回给用户确认或继续执行]
这类工具适合封装重复性很强、步骤比较固定、但又需要 AI 判断的任务。比如剪辑口播视频、润色文本、生成平台内容、安装其他 Skill。
4 个项目解决的问题
| 项目 | 主要用途 | 核心依赖/能力 | 适合场景 |
|---|---|---|---|
| videocut-skills | 自动辅助视频剪辑 | Whisper、FFmpeg | 口播视频、课程视频、访谈素材 |
| Humanizer-zh | 降低文本的模板化表达 | 中文改写规则、AI 写作特征检测 | 文案润色、内容自然化 |
| Auto-Redbook-Skills | 生成并发布小红书笔记 | Playwright、Markdown 渲染、浏览器自动化 | 内容运营、批量制作图文笔记 |
| add-skill | 安装和配置其他 Skill | GitHub 仓库解析、命令行安装 | 多助手环境、批量管理 Skill |
这 4 个项目并不是同一种工具。前三个是具体业务 Skill,分别处理视频、文本和内容发布;add-skill 更像 Skill 管理器,用来把 GitHub 上的 Skill 安装到 Claude Code、Codex、Cursor 等 AI 编程助手中。
videocut-skills:把口播视频粗剪交给 AI
videocut-skills 面向视频剪辑场景,尤其适合处理口播类素材。口播视频里常见的低效工作包括:
- 删除长时间静音;
- 去掉“嗯、啊、那个、然后”等语气词;
- 标出口误位置;
- 生成字幕;
- 按字幕或时间轴裁剪视频。
它的处理链路大致是这样:
flowchart TD
A[导入原始视频] --> B[Whisper 识别语音]
B --> C[生成字幕与时间轴]
C --> D[根据词典纠错]
D --> E[识别口误/静音/语气词]
E --> F[生成剪辑方案]
F --> G[FFmpeg 执行剪切]
G --> H[导出成片或中间素材]
这里有两个关键工具。
Whisper 是语音识别模型,用来把视频里的声音转成文字,并尽量保留时间戳。时间戳很重要,因为剪辑不是只知道“哪句话要删”,还要知道“从第几秒到第几秒要删”。
FFmpeg 是多媒体处理工具,负责真正执行音视频裁剪、拼接、转码等操作。AI 负责判断剪哪里,FFmpeg 负责把剪辑动作落到文件上。
安装 videocut-skills
把项目克隆到 Claude Code 的 skills 目录:
git clone https://github.com/Ceeon/videocut-skills.git ~/.claude/skills/videocut
打开 Claude Code 后输入:
/videocut:安装
安装过程会下载依赖和模型,体积大约 5GB。磁盘空间不足时,最好先清理环境,否则模型下载到一半失败会比较麻烦。
安装完成后,就可以把原始视频交给助手处理,例如让它识别静音、标记口误、按规则生成剪辑方案,再确认是否执行 FFmpeg 剪切。
开源地址:
https://github.com/Ceeon/videocut-skills
使用时要注意什么
| 注意点 | 说明 |
|---|---|
| 先备份原始素材 | 自动剪辑可能覆盖中间文件,原素材不要直接作为唯一副本处理 |
| 字幕识别会出错 | 人名、术语、英文缩写容易识别不准,需要词典纠错 |
| 不要完全跳过人工确认 | AI 可以做粗剪,但节奏、情绪和语义断点仍然需要人判断 |
| 模型占用空间较大 | Whisper 模型和依赖包会占用数 GB 磁盘空间 |
videocut-skills 更适合做“粗剪自动化”,也就是把大量重复删除工作先处理掉。对于剧情类、强节奏类、音乐卡点类视频,它只能承担辅助工作,不能替代人工精剪。
Humanizer-zh:把模板化文本改得更自然
Humanizer-zh 是一个中文改写 Skill,它的目标不是简单替换几个词,而是识别 AI 生成文本里常见的模式化表达,再进行针对性调整。
常见的 AI 文本问题包括:
- 句式过于整齐,段落结构像模板;
- 喜欢使用空泛总结,例如“具有重要意义”“带来全新体验”;
- 转折和因果连接过度使用;
- 语气过于平均,没有重点和节奏变化;
- 表达太满,缺少真实写作中的取舍。
Humanizer-zh 会从内容、语法、风格、交流方式等角度检查文本,然后改写成更接近自然中文表达的版本。
flowchart LR
A[输入待润色文本] --> B[识别模板化表达]
B --> C[检查句式和语气]
C --> D[调整词语和段落节奏]
D --> E[输出更自然的中文文本]
安装 Humanizer-zh
克隆到 Claude Code 的 skills 目录:
git clone https://github.com/op7418/Humanizer-zh.git ~/.claude/skills/humanizer-zh
重启 Claude Code,或重新加载 skills 后,在对话中输入:
/humanizer-zh
如果 Skill 被正常识别,就可以把需要润色的文本交给它处理:
/humanizer-zh
请润色下面这段文字,让表达更自然,保留原意:
……
开源地址:
https://github.com/op7418/Humanizer-zh
更适合把它当作润色工具
Humanizer-zh 适合处理“表达太像机器生成”的文本,但不应该被理解成绕过检测器的保证。AI 检测本身就存在误判,文本是否自然也不只由词语决定,还和内容密度、事实细节、写作目的有关。
更合理的用法是:
| 用法 | 是否合适 | 原因 |
|---|---|---|
| 去掉空泛套话 | 合适 | 能让表达更具体 |
| 调整句子长短 | 合适 | 能改善阅读节奏 |
| 保留事实并改写语气 | 合适 | 不改变信息本身 |
| 批量伪装来源 | 不合适 | 容易造成误导 |
| 依赖它保证通过检测 | 不可靠 | 检测器规则不透明,且误判常见 |
Auto-Redbook-Skills:生成并发布小红书笔记
Auto-Redbook-Skills 面向内容发布流程,覆盖文案生成、图片制作和发布自动化。它把 Markdown 文本渲染成适合小红书风格的图片,并通过浏览器自动化完成发布动作。
它的核心链路可以拆成三段:
flowchart TD
A[输入主题和要求] --> B[生成小红书笔记文案]
B --> C[Markdown 内容排版]
C --> D[Playwright 渲染成图片]
D --> E[生成封面和正文图]
E --> F[浏览器自动化登录发布]
F --> G[发布到小红书]
Playwright 是浏览器自动化工具,可以用代码控制浏览器打开页面、填写表单、点击按钮、截图或渲染页面。Auto-Redbook-Skills 利用这类能力,把 Markdown 内容渲染为图片,并进一步模拟人工发布流程。
它还支持自定义背景渐变和封面样式。对于需要频繁生产图文笔记的人来说,最省时间的部分不是“写一段文案”,而是把文案整理成平台适配的图片,并重复执行上传、填写标题、发布等步骤。
Python 和 Node.js 两种方案
这个项目提供 Python 和 Node.js 两套脚本方案。两种路线的差异主要在生态和运行习惯上:
| 方案 | 更适合谁 | 特点 |
|---|---|---|
| Python | 已经有 Python 环境的人 | 脚本易读,适合和其他内容处理流程组合 |
| Node.js | 熟悉前端和 Playwright 的人 | 浏览器自动化生态更直接 |
| 两者都可以 | 只想跑通流程的人 | 选自己机器上依赖更少的那套 |
基础上手方式是先克隆仓库,再按项目说明选择 Python 或 Node.js 方案安装依赖:
git clone https://github.com/comeonzhj/Auto-Redbook-Skills.git
cd Auto-Redbook-Skills
开源地址:
https://github.com/comeonzhj/Auto-Redbook-Skills
自动发布类工具要特别注意账号安全
浏览器自动化发布通常会涉及登录态、Cookie、账号权限等敏感信息。使用这类工具时,至少要检查三件事:
| 检查项 | 为什么重要 |
|---|---|
| 脚本是否会上传账号信息 | 防止凭证被写入日志或发送到外部服务 |
| 浏览器配置保存在哪里 | 登录态文件泄露后,别人可能直接接管会话 |
| 发布前是否有确认步骤 | 避免生成内容不符合预期却直接发出去 |
如果只是想生成图片,可以先只使用 Markdown 渲染和封面生成部分,把自动发布环节关掉或改成手动确认后再执行。
add-skill:把 Skill 安装流程工具化
add-skill 不是某一个具体业务 Skill,而是 Vercel Labs 开发的命令行工具。CLI(命令行界面)工具的价值在于减少手工复制目录、修改配置、适配不同助手格式这些重复操作。
它面向的场景是:GitHub 上有很多 Skill 仓库,不同助手的安装位置和目录格式不完全一样。如果每次都手动复制文件,很容易出现目录层级错、配置文件没放对、助手识别不到 Skill 等问题。
add-skill 的工作方式可以理解为:
flowchart LR
A[GitHub Skill 仓库] --> B[add-skill 解析仓库]
B --> C[识别 Skill 配置]
C --> D{选择目标助手}
D --> E[Claude Code]
D --> F[Codex]
D --> G[Cursor]
E --> H[写入对应 Skill 目录]
F --> H
G --> H
它适合用在多助手环境里。比如同一个 Skill,希望在 Claude Code 和 Cursor 中都能使用;或者经常尝试 GitHub 上的新 Skill,不想每次都查安装路径。
开源地址:
https://github.com/vercel-labs/add-skill
如果某个 Skill 仓库支持标准化配置,优先考虑用 add-skill 安装;如果仓库没有适配,仍然可以使用手动克隆到指定目录的方式。
手动安装 Skill 的通用思路
以 Claude Code 为例,手动安装 Skill 的核心动作通常只有三个:
flowchart TD
A[找到 Skill 仓库] --> B[克隆到 ~/.claude/skills/某个目录]
B --> C[重启或重新加载 Claude Code]
C --> D[输入 Skill 指令验证]
D --> E{是否识别成功}
E -->|是| F[开始使用]
E -->|否| G[检查目录层级和配置文件]
命令形式一般类似这样:
git clone <skill-repo-url> ~/.claude/skills/<skill-name>
安装后,常见排查点包括:
| 问题 | 可能原因 | 处理方式 |
|---|---|---|
| 输入指令没有反应 | Claude Code 没重新加载 | 重启或刷新 skills |
| Skill 无法运行 | 依赖没装 | 按项目说明安装 Python、Node.js、FFmpeg 等依赖 |
| 识别不到 Skill | 目录层级不对 | 确认 Skill 文件直接位于目标目录下 |
| 执行脚本报权限错误 | 本地脚本没有执行权限 | 检查文件权限和运行环境 |
| 工具下载失败 | 网络或磁盘空间问题 | 换网络、清理空间后重试 |
怎么选择这几个 Skill
| 需求 | 推荐项目 | 选择理由 |
|---|---|---|
| 经常剪口播视频 | videocut-skills | 能自动识别字幕、静音、语气词,并调用 FFmpeg 剪切 |
| 文本太像模板生成 | Humanizer-zh | 能从句式、风格和表达习惯上做中文润色 |
| 批量制作小红书图文 | Auto-Redbook-Skills | 覆盖文案、图片渲染和浏览器发布流程 |
| 经常安装各种 Skill | add-skill | 能减少手工配置成本,适合多助手环境 |
Skill 的本质是把“AI 判断”和“确定性工具”接起来。AI 适合理解意图、判断文本和生成方案;Whisper、FFmpeg、Playwright 这类工具适合执行明确动作。把两者封装在 Skill 里,重复任务就可以从“每次重新讲流程”变成“调用固定能力并确认结果”。