芥末
发布于 2026-01-23 / 0 阅读
0
0

4 个开源 AI Skills:视频剪辑、文本润色、小红书发布与一键安装

AI(人工智能)编程助手里的 Skill(技能包),可以理解成一套“可被助手调用的工作流”。它通常不只是几句提示词,而是把说明文件、脚本、依赖工具、调用约定放在一个目录里,让助手在特定任务中按规则执行。

普通提示词更像一次性指令,Skill 更像可复用插件。比如视频剪辑任务里,助手可以先调用 Whisper 识别字幕,再根据规则找到口误和静音片段,最后用 FFmpeg 执行剪切。用户不需要每次把完整流程重新描述一遍,只要触发对应 Skill 即可。

flowchart LR
    A[用户输入任务] --> B[AI 助手识别意图]
    B --> C[匹配本地 Skill]
    C --> D[读取 Skill 规则]
    D --> E[调用脚本或外部工具]
    E --> F[生成处理结果]
    F --> G[返回给用户确认或继续执行]

这类工具适合封装重复性很强、步骤比较固定、但又需要 AI 判断的任务。比如剪辑口播视频、润色文本、生成平台内容、安装其他 Skill。

4 个项目解决的问题

项目主要用途核心依赖/能力适合场景
videocut-skills自动辅助视频剪辑Whisper、FFmpeg口播视频、课程视频、访谈素材
Humanizer-zh降低文本的模板化表达中文改写规则、AI 写作特征检测文案润色、内容自然化
Auto-Redbook-Skills生成并发布小红书笔记Playwright、Markdown 渲染、浏览器自动化内容运营、批量制作图文笔记
add-skill安装和配置其他 SkillGitHub 仓库解析、命令行安装多助手环境、批量管理 Skill

这 4 个项目并不是同一种工具。前三个是具体业务 Skill,分别处理视频、文本和内容发布;add-skill 更像 Skill 管理器,用来把 GitHub 上的 Skill 安装到 Claude Code、Codex、Cursor 等 AI 编程助手中。

videocut-skills:把口播视频粗剪交给 AI

videocut-skills 面向视频剪辑场景,尤其适合处理口播类素材。口播视频里常见的低效工作包括:

  • 删除长时间静音;
  • 去掉“嗯、啊、那个、然后”等语气词;
  • 标出口误位置;
  • 生成字幕;
  • 按字幕或时间轴裁剪视频。

它的处理链路大致是这样:

flowchart TD
    A[导入原始视频] --> B[Whisper 识别语音]
    B --> C[生成字幕与时间轴]
    C --> D[根据词典纠错]
    D --> E[识别口误/静音/语气词]
    E --> F[生成剪辑方案]
    F --> G[FFmpeg 执行剪切]
    G --> H[导出成片或中间素材]

这里有两个关键工具。

Whisper 是语音识别模型,用来把视频里的声音转成文字,并尽量保留时间戳。时间戳很重要,因为剪辑不是只知道“哪句话要删”,还要知道“从第几秒到第几秒要删”。

FFmpeg 是多媒体处理工具,负责真正执行音视频裁剪、拼接、转码等操作。AI 负责判断剪哪里,FFmpeg 负责把剪辑动作落到文件上。

安装 videocut-skills

把项目克隆到 Claude Code 的 skills 目录:

git clone https://github.com/Ceeon/videocut-skills.git ~/.claude/skills/videocut

打开 Claude Code 后输入:

/videocut:安装

安装过程会下载依赖和模型,体积大约 5GB。磁盘空间不足时,最好先清理环境,否则模型下载到一半失败会比较麻烦。

安装完成后,就可以把原始视频交给助手处理,例如让它识别静音、标记口误、按规则生成剪辑方案,再确认是否执行 FFmpeg 剪切。

开源地址:

https://github.com/Ceeon/videocut-skills

使用时要注意什么

注意点说明
先备份原始素材自动剪辑可能覆盖中间文件,原素材不要直接作为唯一副本处理
字幕识别会出错人名、术语、英文缩写容易识别不准,需要词典纠错
不要完全跳过人工确认AI 可以做粗剪,但节奏、情绪和语义断点仍然需要人判断
模型占用空间较大Whisper 模型和依赖包会占用数 GB 磁盘空间

videocut-skills 更适合做“粗剪自动化”,也就是把大量重复删除工作先处理掉。对于剧情类、强节奏类、音乐卡点类视频,它只能承担辅助工作,不能替代人工精剪。

Humanizer-zh:把模板化文本改得更自然

Humanizer-zh 是一个中文改写 Skill,它的目标不是简单替换几个词,而是识别 AI 生成文本里常见的模式化表达,再进行针对性调整。

常见的 AI 文本问题包括:

  • 句式过于整齐,段落结构像模板;
  • 喜欢使用空泛总结,例如“具有重要意义”“带来全新体验”;
  • 转折和因果连接过度使用;
  • 语气过于平均,没有重点和节奏变化;
  • 表达太满,缺少真实写作中的取舍。

Humanizer-zh 会从内容、语法、风格、交流方式等角度检查文本,然后改写成更接近自然中文表达的版本。

flowchart LR
    A[输入待润色文本] --> B[识别模板化表达]
    B --> C[检查句式和语气]
    C --> D[调整词语和段落节奏]
    D --> E[输出更自然的中文文本]

安装 Humanizer-zh

克隆到 Claude Code 的 skills 目录:

git clone https://github.com/op7418/Humanizer-zh.git ~/.claude/skills/humanizer-zh

重启 Claude Code,或重新加载 skills 后,在对话中输入:

/humanizer-zh

如果 Skill 被正常识别,就可以把需要润色的文本交给它处理:

/humanizer-zh
请润色下面这段文字,让表达更自然,保留原意:
……

开源地址:

https://github.com/op7418/Humanizer-zh

更适合把它当作润色工具

Humanizer-zh 适合处理“表达太像机器生成”的文本,但不应该被理解成绕过检测器的保证。AI 检测本身就存在误判,文本是否自然也不只由词语决定,还和内容密度、事实细节、写作目的有关。

更合理的用法是:

用法是否合适原因
去掉空泛套话合适能让表达更具体
调整句子长短合适能改善阅读节奏
保留事实并改写语气合适不改变信息本身
批量伪装来源不合适容易造成误导
依赖它保证通过检测不可靠检测器规则不透明,且误判常见

Auto-Redbook-Skills:生成并发布小红书笔记

Auto-Redbook-Skills 面向内容发布流程,覆盖文案生成、图片制作和发布自动化。它把 Markdown 文本渲染成适合小红书风格的图片,并通过浏览器自动化完成发布动作。

它的核心链路可以拆成三段:

flowchart TD
    A[输入主题和要求] --> B[生成小红书笔记文案]
    B --> C[Markdown 内容排版]
    C --> D[Playwright 渲染成图片]
    D --> E[生成封面和正文图]
    E --> F[浏览器自动化登录发布]
    F --> G[发布到小红书]

Playwright 是浏览器自动化工具,可以用代码控制浏览器打开页面、填写表单、点击按钮、截图或渲染页面。Auto-Redbook-Skills 利用这类能力,把 Markdown 内容渲染为图片,并进一步模拟人工发布流程。

它还支持自定义背景渐变和封面样式。对于需要频繁生产图文笔记的人来说,最省时间的部分不是“写一段文案”,而是把文案整理成平台适配的图片,并重复执行上传、填写标题、发布等步骤。

Python 和 Node.js 两种方案

这个项目提供 Python 和 Node.js 两套脚本方案。两种路线的差异主要在生态和运行习惯上:

方案更适合谁特点
Python已经有 Python 环境的人脚本易读,适合和其他内容处理流程组合
Node.js熟悉前端和 Playwright 的人浏览器自动化生态更直接
两者都可以只想跑通流程的人选自己机器上依赖更少的那套

基础上手方式是先克隆仓库,再按项目说明选择 Python 或 Node.js 方案安装依赖:

git clone https://github.com/comeonzhj/Auto-Redbook-Skills.git
cd Auto-Redbook-Skills

开源地址:

https://github.com/comeonzhj/Auto-Redbook-Skills

自动发布类工具要特别注意账号安全

浏览器自动化发布通常会涉及登录态、Cookie、账号权限等敏感信息。使用这类工具时,至少要检查三件事:

检查项为什么重要
脚本是否会上传账号信息防止凭证被写入日志或发送到外部服务
浏览器配置保存在哪里登录态文件泄露后,别人可能直接接管会话
发布前是否有确认步骤避免生成内容不符合预期却直接发出去

如果只是想生成图片,可以先只使用 Markdown 渲染和封面生成部分,把自动发布环节关掉或改成手动确认后再执行。

add-skill:把 Skill 安装流程工具化

add-skill 不是某一个具体业务 Skill,而是 Vercel Labs 开发的命令行工具。CLI(命令行界面)工具的价值在于减少手工复制目录、修改配置、适配不同助手格式这些重复操作。

它面向的场景是:GitHub 上有很多 Skill 仓库,不同助手的安装位置和目录格式不完全一样。如果每次都手动复制文件,很容易出现目录层级错、配置文件没放对、助手识别不到 Skill 等问题。

add-skill 的工作方式可以理解为:

flowchart LR
    A[GitHub Skill 仓库] --> B[add-skill 解析仓库]
    B --> C[识别 Skill 配置]
    C --> D{选择目标助手}
    D --> E[Claude Code]
    D --> F[Codex]
    D --> G[Cursor]
    E --> H[写入对应 Skill 目录]
    F --> H
    G --> H

它适合用在多助手环境里。比如同一个 Skill,希望在 Claude Code 和 Cursor 中都能使用;或者经常尝试 GitHub 上的新 Skill,不想每次都查安装路径。

开源地址:

https://github.com/vercel-labs/add-skill

如果某个 Skill 仓库支持标准化配置,优先考虑用 add-skill 安装;如果仓库没有适配,仍然可以使用手动克隆到指定目录的方式。

手动安装 Skill 的通用思路

以 Claude Code 为例,手动安装 Skill 的核心动作通常只有三个:

flowchart TD
    A[找到 Skill 仓库] --> B[克隆到 ~/.claude/skills/某个目录]
    B --> C[重启或重新加载 Claude Code]
    C --> D[输入 Skill 指令验证]
    D --> E{是否识别成功}
    E -->|是| F[开始使用]
    E -->|否| G[检查目录层级和配置文件]

命令形式一般类似这样:

git clone <skill-repo-url> ~/.claude/skills/<skill-name>

安装后,常见排查点包括:

问题可能原因处理方式
输入指令没有反应Claude Code 没重新加载重启或刷新 skills
Skill 无法运行依赖没装按项目说明安装 Python、Node.js、FFmpeg 等依赖
识别不到 Skill目录层级不对确认 Skill 文件直接位于目标目录下
执行脚本报权限错误本地脚本没有执行权限检查文件权限和运行环境
工具下载失败网络或磁盘空间问题换网络、清理空间后重试

怎么选择这几个 Skill

需求推荐项目选择理由
经常剪口播视频videocut-skills能自动识别字幕、静音、语气词,并调用 FFmpeg 剪切
文本太像模板生成Humanizer-zh能从句式、风格和表达习惯上做中文润色
批量制作小红书图文Auto-Redbook-Skills覆盖文案、图片渲染和浏览器发布流程
经常安装各种 Skilladd-skill能减少手工配置成本,适合多助手环境

Skill 的本质是把“AI 判断”和“确定性工具”接起来。AI 适合理解意图、判断文本和生成方案;Whisper、FFmpeg、Playwright 这类工具适合执行明确动作。把两者封装在 Skill 里,重复任务就可以从“每次重新讲流程”变成“调用固定能力并确认结果”。


评论