芥末
发布于 2026-03-09 / 0 阅读
0
0

OpenClaw SKILL 插件选型指南:15 个常用插件和一个网页抓取补充

OpenClaw,也常被称作“小龙虾”,可以理解成一个可扩展的 AI(人工智能)助手框架。默认情况下,AI 主要负责理解问题和生成回答;装上 SKILL 之后,它就能调用更多工具,例如读取网页、处理 PDF(便携式文档格式)、转写音频、操作 GitHub、访问本地笔记库。

SKILL 的价值不在于“多装几个插件”,而在于把 AI 从单纯聊天变成可执行任务的工作台。一个任务原本可能要在浏览器、文件管理器、PDF 软件、代码仓库、笔记软件之间切换,接入 SKILL 后,可以变成一句自然语言指令。

flowchart LR
    U[用户输入自然语言任务] --> O[OpenClaw]
    O --> R[判断需要调用哪个 SKILL]
    R --> S1[网页读取 / 搜索]
    R --> S2[本地文件 / 音视频处理]
    R --> S3[PDF / Markdown 转换]
    R --> S4[GitHub / Obsidian / 外部服务]
    S1 --> O
    S2 --> O
    S3 --> O
    S4 --> O
    O --> A[整理结果并返回]

SKILL 一般可以在 ClawHub 找到。安装时最重要的是两件事:一是搞清楚它能访问什么资源,二是确认它是否真的匹配自己的工作流。文件系统、浏览器登录状态、代码仓库、笔记库、API(应用程序编程接口)密钥都属于敏感资源,不能把权限随便交给来路不明的插件。

OpenClaw SKILL 该怎么选

如果只按下载量安装,很容易装出一堆用不到的能力。更实用的方式是按任务类型选:

任务类型典型需求推荐 SKILL
插件发现不知道该装什么能力find-skills
内容理解总结网页、PDF、视频、音频summarize
音视频处理语音转文字、提取视频画面openai-whisper、video-frames
文档处理修改 PDF、格式转 Markdownnano-pdf、markdown-converter
图片生成与编辑根据描述生成图、改图nano-banana-pro
研发协作查项目、看 Issue、处理 PR、看 CIgithub
写作润色减少 AI 腔和模板话humanizer
主动助理定时检查、主动提醒、恢复上下文proactive-agent
知识库读写 Obsidian Vaultobsidian
长期记忆记录偏好、规则、历史决策memory-setup、self-improving
金融分析生成股票技术指标图和报告stock-market-pro
安全审查安装陌生插件前检查风险skill-vetter
网页抓取读取普通网页、登录页、公众号等内容web-content-fetcher

1. find-skills:让 OpenClaw 自己找插件

用途:根据需求在 ClawHub 里寻找合适的 SKILL。
地址clawhub.ai/JimLiuxinghai/find-skills

当你只知道自己想完成什么任务,却不知道该装哪个插件时,find-skills 就很有用。比如输入:

我想让 OpenClaw 帮我订阅日历,有没有合适的 SKILL?

或者:

帮我找一个可以搜索 Reddit 内容的 SKILL。

它会去 ClawHub 里匹配相关能力,再把候选插件推荐出来。这个插件适合作为基础工具先装,因为后续扩展能力时可以少翻很多列表。

适合场景:

  • 刚开始使用 OpenClaw,不熟悉 SKILL 生态;
  • 想找某类能力,但不知道准确插件名;
  • 需要比较多个同类插件。

注意点:

  • 它负责“发现插件”,不等于替你判断插件一定安全;
  • 对涉及文件、账号、网络权限的插件,仍然应该单独审查。

2. summarize:把网页、文件和视频变成摘要

用途:总结网页、PDF、图片、音频、YouTube 视频等内容。
地址clawhub.ai/steipete/summarize

summarize 解决的是信息过载问题。长网页、研究材料、会议录音、视频链接都可以先交给它提炼主要内容,再决定要不要深入处理。

常见用法:

帮我总结这个链接的核心观点,并列出里面提到的关键数据。
总结这个 PDF,按“背景、方法、结论、风险”四部分输出。

它特别适合做“预处理”:把非结构化内容压缩成结构化信息,让后续分析、写作、归档更容易。

输入类型可以得到什么
网页链接主题、要点、结论、引用信息
PDF 文件章节摘要、关键概念、待确认问题
音频 / 视频主要内容、时间线、行动项
图片图片中的文字或视觉信息摘要

3. openai-whisper:本地语音转文字

用途:把音频或视频里的语音转成文字。
地址clawhub.ai/steipete/openai-whisper

openai-whisper 基于 Whisper 语音识别能力,本地运行,不需要额外配置 API key,也不需要把音频上传到远程服务。对于会议录音、采访录音、课程视频、字幕生成这类任务,本地处理有两个好处:成本低,隐私风险也更可控。

典型指令:

把这个会议录音转成文字,并按发言人整理成会议纪要。
从这个视频里提取字幕,再总结成 10 条要点。

适合场景:

  • 会议纪要;
  • 访谈整理;
  • 视频字幕;
  • 课程内容归档;
  • 不方便上传到外部平台的音频资料。

需要注意的是,本地语音识别会消耗电脑算力,长音频可能需要等待一段时间。如果机器性能较弱,可以先切分音频,再分段转写。

4. nano-pdf:用自然语言修改 PDF

用途:通过对话方式编辑 PDF。
地址clawhub.ai/steipete/nano-pdf

PDF 往往适合分发和阅读,但不适合直接修改。nano-pdf 把“点菜单、找工具、框选内容”的操作变成自然语言指令,例如:

把第三页标题改成“季度经营分析”。
在第二页末尾追加一段说明:本报告数据截至 2026 年 3 月。
删除第五页的页脚,并保持其他页面不变。

它适合做轻量修改,不一定适合复杂排版设计。遇到合同、报价单、报告这类格式敏感文件,修改后要人工复查版式、分页、字体和内容是否错位。

5. nano-banana-pro:在对话框里生成和编辑图片

用途:根据描述生成图片,也可以基于已有图片继续编辑。
地址clawhub.ai/steipete/nano-banana-pro

nano-banana-pro 把图片生成能力接入 OpenClaw,支持 1K、2K、4K 分辨率输出,也能对已有图片做二次编辑。常见需求包括换背景、改风格、添加文字、生成海报草图、制作配图方案等。

示例:

生成一张 16:9 的科技博客封面图,主题是 AI Agent 工作流,风格简洁,深色背景。
基于这张图片,把背景换成办公室环境,保留人物主体。

使用时要把要求说具体,尤其是尺寸、比例、风格、主体、文字内容和用途。图片生成类任务很容易因为描述模糊而反复修改,提示词越结构化,返工越少。

6. github:在聊天框里处理 GitHub 工作

用途:搜索开源项目、查看 Issue、处理 PR(Pull Request,代码合并请求)、查询 CI(持续集成)状态。
地址clawhub.ai/steipete/github

github SKILL 适合把研发协作中的查询类工作搬进对话框。比如:

帮我查一下这个仓库最近打开的高优先级 Issue。
总结这个 PR 改了哪些文件,是否可能影响登录流程。
检查最近一次 CI 失败的原因。

对于开发者来说,最大变化是不用频繁在浏览器、终端、编辑器和聊天窗口之间切换。AI 可以先把仓库信息整理成自然语言,再辅助判断下一步该看哪里。

使用时要注意权限范围。只读查询和写入操作风险不同,如果 SKILL 需要提交评论、创建 Issue、合并 PR,就要确认授权账号和仓库范围。

7. humanizer:减少 AI 生成内容的模板感

用途:改写 AI 生成文本,去掉常见套话。
地址clawhub.ai/biostartechnology/humanizer

很多 AI 文本会出现固定句式,例如“值得注意的是”“不仅……而且……”“总而言之”等。humanizer 的作用是识别这些模板表达,并替换成更自然的说法。

适合处理:

  • 博客初稿;
  • 产品说明;
  • 邮件草稿;
  • 社交媒体内容;
  • 客服回复。

一个实用流程是:先让 AI 输出结构完整的草稿,再用 humanizer 做语言层面的清理。它不负责事实校验,改完后仍然要检查数字、引用、技术细节是否准确。

8. proactive-agent:让 AI 从被动回答变成主动协助

用途:让 AI 主动预判需求、定时检查任务、恢复上下文。
地址clawhub.ai/halthelobster/proactive-agent

大多数 AI 助手默认是“问一句,答一句”。proactive-agent 的目标是让 AI 有一定主动性,例如定期检查你关心的信息、根据上下文提醒可能遗漏的事项,或者在上下文丢失后尝试恢复工作状态。

典型任务:

每天上午检查我关注的项目是否有新的 Release,并汇总变化。
如果我连续处理同一类文档,主动提醒我是否要保存成模板流程。
当任务上下文不完整时,先根据历史记录恢复背景,再继续执行。

主动型插件的关键是边界设置。哪些事情可以自动做,哪些事情必须询问确认,要提前定义清楚。涉及删除文件、提交代码、发送消息、调用付费服务的动作,不适合默认自动执行。

9. obsidian:让 OpenClaw 读写本地知识库

用途:连接 Obsidian Vault,搜索、新建、更新笔记。
地址clawhub.ai/steipete/obsidian

Obsidian 是很多人用来维护本地知识库的工具。obsidian SKILL 可以让 OpenClaw 直接访问 Vault,把“找笔记、补充笔记、整理链接关系”变成对话指令。

示例:

找一下我关于向量数据库的笔记,并按时间排序。
新建一篇关于 OpenClaw SKILL 的笔记,放到 AI/Tools 目录下。
把这段会议纪要追加到“项目A/周会记录.md”里。

它适合已经有 Obsidian 工作流的人。如果平时不用 Obsidian,单独为了这个 SKILL 建知识库,收益不一定高。使用前要确认 Vault 路径、写入权限和备份策略,避免误改重要笔记。

10. memory-setup:给 AI 配置持久记忆

用途:让 OpenClaw 记住偏好、习惯和长期规则。
地址clawhub.ai/jrbobbyhansen-pixel/memory-setup

普通对话会话通常是短期的,新的会话不一定知道你之前设定过什么。memory-setup 解决的是长期记忆问题,例如记住你的写作风格、常用目录、项目约定、决策背景等。

可以保存的信息包括:

记忆类型示例
偏好输出 Markdown,不要使用太多表情
工作习惯代码解释要附带测试方法
项目规则配置文件放在 config/ 目录
历史决策某个方案被放弃的原因

持久记忆越强,越要重视清理机制。过期偏好、错误结论、临时规则如果长期留存,会影响后续回答。建议定期查看记忆内容,删除不再适用的部分。

11. stock-market-pro:生成股票技术分析图表

用途:根据股票代码生成技术指标图表和分析报告。
地址clawhub.ai/kys42/stock-market-pro

stock-market-pro 面向股市研究场景,可以生成包含 RSI(相对强弱指标)、MACD(指数平滑异同移动平均线)、布林带等技术指标的图表,并输出分析报告。

示例:

分析 AAPL 最近三个月走势,生成包含 RSI、MACD 和布林带的图表。
对比 TSLA 和 NVDA 的近期技术形态,列出主要支撑位和压力位。

它适合做研究辅助,不适合作为自动交易依据。技术指标只能描述价格和成交量的某些特征,不能保证未来走势。涉及投资决策时,还需要结合基本面、市场环境、风险承受能力等因素。

12. markdown-converter:把各种文件转成 Markdown

用途:把 PDF、Word、PPT、Excel、HTML、图片、音频等格式转成 Markdown。
地址clawhub.ai/steipete/markdown-converter

AI 更擅长处理结构清晰的文本。很多原始材料分散在不同格式里,直接分析会很麻烦。markdown-converter 的作用是把这些材料统一转换成 Markdown,方便后续总结、检索、改写和归档。

常见流程:

flowchart LR
    A[PDF / Word / PPT / Excel / HTML] --> B[markdown-converter]
    B --> C[Markdown 文本]
    C --> D[总结]
    C --> E[问答]
    C --> F[知识库归档]
    C --> G[二次写作]

适合场景:

  • 把客户给的 Word、PPT 转成可分析文本;
  • 把网页和 HTML 文档转成知识库资料;
  • 把表格内容转换成可读结构;
  • 把文件内容交给 AI 做进一步处理。

转换后要检查表格、脚注、图片说明和复杂排版。格式转换不是语义理解,遇到扫描版 PDF 或结构复杂的 PPT,可能需要人工修正。

13. self-improving:把纠错经验沉淀下来

用途:记录 AI 被纠正后的经验,减少同类错误重复出现。
地址clawhub.ai/ivangdavila/self-improving

self-improving 和 memory-setup 都和记忆有关,但侧重点不同。memory-setup 更像是配置长期偏好和规则,self-improving 更像是从错误中提炼经验。

例如你纠正 AI:

以后写接口文档时,请把错误码单独列成表格,不要混在正文里。

self-improving 可以把这次纠正沉淀成规则,下次遇到类似任务时自动应用。

适合场景:

  • 固定格式文档生成;
  • 代码风格和项目约定;
  • 长期反复出现的纠错点;
  • 团队内部规范沉淀。

需要注意的是,自动学习并不总是好事。如果某次纠正只适用于临时任务,却被当成通用规则记住,后续可能产生副作用。因此要给规则加上下文,例如“仅限项目 A”“仅限中文技术博客”“仅限内部周报”。

14. skill-vetter:安装前检查 SKILL 风险

用途:审查陌生 SKILL 的权限、行为和潜在安全问题。
地址clawhub.ai/spclaudehome/skill-vetter

SKILL 能力越强,越可能接触敏感资源。skill-vetter 适合在安装陌生插件前使用,尤其是插件要求访问文件系统、网络、浏览器状态、账号令牌或代码仓库时。

可以检查的方向包括:

检查项需要关注的问题
权限范围是否要求过多文件或网络权限
外部请求是否把内容发送到不明地址
写入行为是否会修改、删除、上传本地文件
凭证处理是否读取 API key、Cookie、Token
依赖来源是否依赖可疑包或脚本

一个稳妥的安装顺序是:先装基础可信插件,再用 skill-vetter 审查其他插件。对于需要高权限的 SKILL,可以先在测试目录或独立环境里试运行。

15. video-frames:从视频中提取关键帧

用途:使用 ffmpeg 从视频里提取关键帧或短片段。
地址clawhub.ai/steipete/video-frames

video-frames 适合内容分析和视频素材处理。比如要分析一个演示视频的画面变化,或者从视频中截取代表性帧做封面、笔记、报告,都可以交给它完成。

示例:

从这个视频每隔 10 秒提取一帧,并按时间命名。
提取视频中画面变化明显的关键帧,用于内容分析。
截取 00:01:20 到 00:01:45 之间的片段。

它适合处理“从视频里拿素材”的任务,不适合替代专业剪辑软件。需要复杂调色、多轨剪辑、字幕包装时,仍然应该进入视频编辑工具。

补充:web-content-fetcher,用来读取复杂网页

用途:抓取网页正文,并返回干净的 Markdown。
地址github.com/shirenchuang/web-content-fetcher

web-content-fetcher 解决的是网页读取失败的问题。有些页面用普通抓取方式拿不到正文,例如动态渲染页面、登录后可见页面、微信公众号内容,或者 Jina Reader 读取不完整的页面。它通过多级降级策略兜底,尽量把页面正文提取成适合 AI 处理的 Markdown。

适合场景:

  • 抓取普通网页正文;
  • 读取需要登录状态的页面;
  • 提取微信公众号内容;
  • 把网页材料整理进知识库;
  • 给 summarize、markdown-converter 等后续处理提供干净输入。

使用登录页面抓取时,要注意账号权限和隐私边界。能读取不代表应该读取,内部系统、付费内容、个人数据都要按授权范围处理。

按工作流组合安装

不同人不需要同一套 SKILL。按工作方式组合,通常比一次装满更合理。

使用人群推荐组合能解决的问题
内容创作summarize、openai-whisper、video-frames、humanizer、nano-banana-pro总结资料、转写音频、提取视频素材、润色文本、生成配图
研发人员github、markdown-converter、summarize、skill-vetter、memory-setup查仓库、看 PR、整理技术文档、审查插件、记录项目规则
知识管理obsidian、markdown-converter、summarize、memory-setup、self-improving文件转 Markdown、归档笔记、沉淀长期规则
自动化助理proactive-agent、memory-setup、self-improving、find-skills主动检查任务、保存偏好、积累纠错经验、发现新能力
金融研究stock-market-pro、summarize、markdown-converter技术指标分析、整理研报、归档数据材料

如果只想先装一组通用插件,可以从这些开始:

帮我安装这些 SKILL:
find-skills、summarize、openai-whisper、markdown-converter、skill-vetter、memory-setup

这组覆盖了插件发现、内容总结、语音转写、格式转换、安全审查和长期记忆,适合大多数人作为基础配置。

如果主要做内容处理,可以换成:

帮我安装这些 SKILL:
summarize、openai-whisper、video-frames、humanizer、nano-banana-pro、markdown-converter

如果主要做开发协作,可以使用:

帮我安装这些 SKILL:
github、summarize、markdown-converter、skill-vetter、memory-setup、self-improving

安装前的权限检查清单

SKILL 本质上是在给 AI 增加可调用工具。工具越强,越要把权限边界想清楚。

问题为什么重要
它是否需要访问本地文件?可能读取或修改私人资料、项目代码
它是否需要联网?可能把输入内容发送到外部服务
它是否需要账号授权?GitHub、Obsidian、浏览器登录状态都可能涉及敏感数据
它是否会写入文件?自动修改 PDF、笔记、代码时可能造成误操作
它是否调用付费服务?图片生成、外部 API 可能产生成本
它是否能自动执行任务?主动型插件要限制删除、发送、提交等高风险动作

比较稳妥的做法是:高权限插件少装,能只读就不要给写入权限,能限制目录就不要开放整个磁盘。对于陌生 SKILL,先用 skill-vetter 检查,再在低风险环境试运行。

15 个 SKILL 速查表

#SKILL核心用途更适合谁
1find-skills根据需求发现插件所有 OpenClaw 用户
2summarize总结网页、PDF、视频、音频内容处理、资料研究
3openai-whisper本地语音转文字会议、访谈、视频字幕
4nano-pdf用自然语言修改 PDF文档处理
5nano-banana-pro生成和编辑图片内容创作、设计草图
6github在对话框里操作 GitHub开发者
7humanizer清理 AI 文本模板感写作、运营、文案
8proactive-agent主动检查和提醒自动化工作流
9obsidian读写 Obsidian 知识库笔记重度用户
10memory-setup配置长期记忆需要稳定偏好的用户
11stock-market-pro股票技术指标图和报告金融研究
12markdown-converter多格式转 Markdown文档整理、知识库
13self-improving从纠错中沉淀规则长期重复任务
14skill-vetter安装前安全审查所有 OpenClaw 用户
15video-frames提取视频关键帧或片段视频分析、内容制作
补充web-content-fetcher读取复杂网页并转 Markdown网页资料抓取

OpenClaw 的 SKILL 系统最适合从小组合开始搭建。先安装能明显减少重复劳动的插件,再根据真实任务逐步扩展;每装一个高权限插件,都要确认它访问什么、修改什么、是否会联网,以及出错时能不能回滚。这样才能把 OpenClaw 用成稳定的工作台,而不是堆满插件的聊天窗口。


评论