OpenClaw SKILL 插件选型指南：15 个常用插件和一个网页抓取补充

OpenClaw，也常被称作“小龙虾”，可以理解成一个可扩展的 AI（人工智能）助手框架。默认情况下，AI 主要负责理解问题和生成回答；装上 SKILL 之后，它就能调用更多工具，例如读取网页、处理 PDF（便携式文档格式）、转写音频、操作 GitHub、访问本地笔记库。

SKILL 的价值不在于“多装几个插件”，而在于把 AI 从单纯聊天变成可执行任务的工作台。一个任务原本可能要在浏览器、文件管理器、PDF 软件、代码仓库、笔记软件之间切换，接入 SKILL 后，可以变成一句自然语言指令。

flowchart LR
    U[用户输入自然语言任务] --> O[OpenClaw]
    O --> R[判断需要调用哪个 SKILL]
    R --> S1[网页读取 / 搜索]
    R --> S2[本地文件 / 音视频处理]
    R --> S3[PDF / Markdown 转换]
    R --> S4[GitHub / Obsidian / 外部服务]
    S1 --> O
    S2 --> O
    S3 --> O
    S4 --> O
    O --> A[整理结果并返回]

SKILL 一般可以在 ClawHub 找到。安装时最重要的是两件事：一是搞清楚它能访问什么资源，二是确认它是否真的匹配自己的工作流。文件系统、浏览器登录状态、代码仓库、笔记库、API（应用程序编程接口）密钥都属于敏感资源，不能把权限随便交给来路不明的插件。

OpenClaw SKILL 该怎么选

如果只按下载量安装，很容易装出一堆用不到的能力。更实用的方式是按任务类型选：

任务类型	典型需求	推荐 SKILL
插件发现	不知道该装什么能力	find-skills
内容理解	总结网页、PDF、视频、音频	summarize
音视频处理	语音转文字、提取视频画面	openai-whisper、video-frames
文档处理	修改 PDF、格式转 Markdown	nano-pdf、markdown-converter
图片生成与编辑	根据描述生成图、改图	nano-banana-pro
研发协作	查项目、看 Issue、处理 PR、看 CI	github
写作润色	减少 AI 腔和模板话	humanizer
主动助理	定时检查、主动提醒、恢复上下文	proactive-agent
知识库	读写 Obsidian Vault	obsidian
长期记忆	记录偏好、规则、历史决策	memory-setup、self-improving
金融分析	生成股票技术指标图和报告	stock-market-pro
安全审查	安装陌生插件前检查风险	skill-vetter
网页抓取	读取普通网页、登录页、公众号等内容	web-content-fetcher

1. find-skills：让 OpenClaw 自己找插件

用途：根据需求在 ClawHub 里寻找合适的 SKILL。
地址：clawhub.ai/JimLiuxinghai/find-skills

当你只知道自己想完成什么任务，却不知道该装哪个插件时，find-skills 就很有用。比如输入：

我想让 OpenClaw 帮我订阅日历，有没有合适的 SKILL？

或者：

帮我找一个可以搜索 Reddit 内容的 SKILL。

它会去 ClawHub 里匹配相关能力，再把候选插件推荐出来。这个插件适合作为基础工具先装，因为后续扩展能力时可以少翻很多列表。

适合场景：

刚开始使用 OpenClaw，不熟悉 SKILL 生态；
想找某类能力，但不知道准确插件名；
需要比较多个同类插件。

注意点：

它负责“发现插件”，不等于替你判断插件一定安全；
对涉及文件、账号、网络权限的插件，仍然应该单独审查。

2. summarize：把网页、文件和视频变成摘要

用途：总结网页、PDF、图片、音频、YouTube 视频等内容。
地址：clawhub.ai/steipete/summarize

summarize 解决的是信息过载问题。长网页、研究材料、会议录音、视频链接都可以先交给它提炼主要内容，再决定要不要深入处理。

常见用法：

帮我总结这个链接的核心观点，并列出里面提到的关键数据。

总结这个 PDF，按“背景、方法、结论、风险”四部分输出。

它特别适合做“预处理”：把非结构化内容压缩成结构化信息，让后续分析、写作、归档更容易。

输入类型	可以得到什么
网页链接	主题、要点、结论、引用信息
PDF 文件	章节摘要、关键概念、待确认问题
音频 / 视频	主要内容、时间线、行动项
图片	图片中的文字或视觉信息摘要

3. openai-whisper：本地语音转文字

用途：把音频或视频里的语音转成文字。
地址：clawhub.ai/steipete/openai-whisper

openai-whisper 基于 Whisper 语音识别能力，本地运行，不需要额外配置 API key，也不需要把音频上传到远程服务。对于会议录音、采访录音、课程视频、字幕生成这类任务，本地处理有两个好处：成本低，隐私风险也更可控。

典型指令：

把这个会议录音转成文字，并按发言人整理成会议纪要。

从这个视频里提取字幕，再总结成 10 条要点。

适合场景：

会议纪要；
访谈整理；
视频字幕；
课程内容归档；
不方便上传到外部平台的音频资料。

需要注意的是，本地语音识别会消耗电脑算力，长音频可能需要等待一段时间。如果机器性能较弱，可以先切分音频，再分段转写。

4. nano-pdf：用自然语言修改 PDF

用途：通过对话方式编辑 PDF。
地址：clawhub.ai/steipete/nano-pdf

PDF 往往适合分发和阅读，但不适合直接修改。nano-pdf 把“点菜单、找工具、框选内容”的操作变成自然语言指令，例如：

把第三页标题改成“季度经营分析”。

在第二页末尾追加一段说明：本报告数据截至 2026 年 3 月。

删除第五页的页脚，并保持其他页面不变。

它适合做轻量修改，不一定适合复杂排版设计。遇到合同、报价单、报告这类格式敏感文件，修改后要人工复查版式、分页、字体和内容是否错位。

5. nano-banana-pro：在对话框里生成和编辑图片

用途：根据描述生成图片，也可以基于已有图片继续编辑。
地址：clawhub.ai/steipete/nano-banana-pro

nano-banana-pro 把图片生成能力接入 OpenClaw，支持 1K、2K、4K 分辨率输出，也能对已有图片做二次编辑。常见需求包括换背景、改风格、添加文字、生成海报草图、制作配图方案等。

示例：

生成一张 16:9 的科技博客封面图，主题是 AI Agent 工作流，风格简洁，深色背景。

基于这张图片，把背景换成办公室环境，保留人物主体。

使用时要把要求说具体，尤其是尺寸、比例、风格、主体、文字内容和用途。图片生成类任务很容易因为描述模糊而反复修改，提示词越结构化，返工越少。

6. github：在聊天框里处理 GitHub 工作

用途：搜索开源项目、查看 Issue、处理 PR（Pull Request，代码合并请求）、查询 CI（持续集成）状态。
地址：clawhub.ai/steipete/github

github SKILL 适合把研发协作中的查询类工作搬进对话框。比如：

帮我查一下这个仓库最近打开的高优先级 Issue。

总结这个 PR 改了哪些文件，是否可能影响登录流程。

检查最近一次 CI 失败的原因。

对于开发者来说，最大变化是不用频繁在浏览器、终端、编辑器和聊天窗口之间切换。AI 可以先把仓库信息整理成自然语言，再辅助判断下一步该看哪里。

使用时要注意权限范围。只读查询和写入操作风险不同，如果 SKILL 需要提交评论、创建 Issue、合并 PR，就要确认授权账号和仓库范围。

7. humanizer：减少 AI 生成内容的模板感

用途：改写 AI 生成文本，去掉常见套话。
地址：clawhub.ai/biostartechnology/humanizer

很多 AI 文本会出现固定句式，例如“值得注意的是”“不仅……而且……”“总而言之”等。humanizer 的作用是识别这些模板表达，并替换成更自然的说法。

适合处理：

博客初稿；
产品说明；
邮件草稿；
社交媒体内容；
客服回复。

一个实用流程是：先让 AI 输出结构完整的草稿，再用 humanizer 做语言层面的清理。它不负责事实校验，改完后仍然要检查数字、引用、技术细节是否准确。

8. proactive-agent：让 AI 从被动回答变成主动协助

用途：让 AI 主动预判需求、定时检查任务、恢复上下文。
地址：clawhub.ai/halthelobster/proactive-agent

大多数 AI 助手默认是“问一句，答一句”。proactive-agent 的目标是让 AI 有一定主动性，例如定期检查你关心的信息、根据上下文提醒可能遗漏的事项，或者在上下文丢失后尝试恢复工作状态。

典型任务：

每天上午检查我关注的项目是否有新的 Release，并汇总变化。

如果我连续处理同一类文档，主动提醒我是否要保存成模板流程。

当任务上下文不完整时，先根据历史记录恢复背景，再继续执行。

主动型插件的关键是边界设置。哪些事情可以自动做，哪些事情必须询问确认，要提前定义清楚。涉及删除文件、提交代码、发送消息、调用付费服务的动作，不适合默认自动执行。

9. obsidian：让 OpenClaw 读写本地知识库

用途：连接 Obsidian Vault，搜索、新建、更新笔记。
地址：clawhub.ai/steipete/obsidian

Obsidian 是很多人用来维护本地知识库的工具。obsidian SKILL 可以让 OpenClaw 直接访问 Vault，把“找笔记、补充笔记、整理链接关系”变成对话指令。

示例：

找一下我关于向量数据库的笔记，并按时间排序。

新建一篇关于 OpenClaw SKILL 的笔记，放到 AI/Tools 目录下。

把这段会议纪要追加到“项目A/周会记录.md”里。

它适合已经有 Obsidian 工作流的人。如果平时不用 Obsidian，单独为了这个 SKILL 建知识库，收益不一定高。使用前要确认 Vault 路径、写入权限和备份策略，避免误改重要笔记。

10. memory-setup：给 AI 配置持久记忆

用途：让 OpenClaw 记住偏好、习惯和长期规则。
地址：clawhub.ai/jrbobbyhansen-pixel/memory-setup

普通对话会话通常是短期的，新的会话不一定知道你之前设定过什么。memory-setup 解决的是长期记忆问题，例如记住你的写作风格、常用目录、项目约定、决策背景等。

可以保存的信息包括：

记忆类型	示例
偏好	输出 Markdown，不要使用太多表情
工作习惯	代码解释要附带测试方法
项目规则	配置文件放在 `config/` 目录
历史决策	某个方案被放弃的原因

持久记忆越强，越要重视清理机制。过期偏好、错误结论、临时规则如果长期留存，会影响后续回答。建议定期查看记忆内容，删除不再适用的部分。

11. stock-market-pro：生成股票技术分析图表

用途：根据股票代码生成技术指标图表和分析报告。
地址：clawhub.ai/kys42/stock-market-pro

stock-market-pro 面向股市研究场景，可以生成包含 RSI（相对强弱指标）、MACD（指数平滑异同移动平均线）、布林带等技术指标的图表，并输出分析报告。

示例：

分析 AAPL 最近三个月走势，生成包含 RSI、MACD 和布林带的图表。

对比 TSLA 和 NVDA 的近期技术形态，列出主要支撑位和压力位。

它适合做研究辅助，不适合作为自动交易依据。技术指标只能描述价格和成交量的某些特征，不能保证未来走势。涉及投资决策时，还需要结合基本面、市场环境、风险承受能力等因素。

12. markdown-converter：把各种文件转成 Markdown

用途：把 PDF、Word、PPT、Excel、HTML、图片、音频等格式转成 Markdown。
地址：clawhub.ai/steipete/markdown-converter

AI 更擅长处理结构清晰的文本。很多原始材料分散在不同格式里，直接分析会很麻烦。markdown-converter 的作用是把这些材料统一转换成 Markdown，方便后续总结、检索、改写和归档。

常见流程：

flowchart LR
    A[PDF / Word / PPT / Excel / HTML] --> B[markdown-converter]
    B --> C[Markdown 文本]
    C --> D[总结]
    C --> E[问答]
    C --> F[知识库归档]
    C --> G[二次写作]

适合场景：

把客户给的 Word、PPT 转成可分析文本；
把网页和 HTML 文档转成知识库资料；
把表格内容转换成可读结构；
把文件内容交给 AI 做进一步处理。

转换后要检查表格、脚注、图片说明和复杂排版。格式转换不是语义理解，遇到扫描版 PDF 或结构复杂的 PPT，可能需要人工修正。

13. self-improving：把纠错经验沉淀下来

用途：记录 AI 被纠正后的经验，减少同类错误重复出现。
地址：clawhub.ai/ivangdavila/self-improving

self-improving 和 memory-setup 都和记忆有关，但侧重点不同。memory-setup 更像是配置长期偏好和规则，self-improving 更像是从错误中提炼经验。

例如你纠正 AI：

以后写接口文档时，请把错误码单独列成表格，不要混在正文里。

self-improving 可以把这次纠正沉淀成规则，下次遇到类似任务时自动应用。

适合场景：

固定格式文档生成；
代码风格和项目约定；
长期反复出现的纠错点；
团队内部规范沉淀。

需要注意的是，自动学习并不总是好事。如果某次纠正只适用于临时任务，却被当成通用规则记住，后续可能产生副作用。因此要给规则加上下文，例如“仅限项目 A”“仅限中文技术博客”“仅限内部周报”。

14. skill-vetter：安装前检查 SKILL 风险

用途：审查陌生 SKILL 的权限、行为和潜在安全问题。
地址：clawhub.ai/spclaudehome/skill-vetter

SKILL 能力越强，越可能接触敏感资源。skill-vetter 适合在安装陌生插件前使用，尤其是插件要求访问文件系统、网络、浏览器状态、账号令牌或代码仓库时。

可以检查的方向包括：

检查项	需要关注的问题
权限范围	是否要求过多文件或网络权限
外部请求	是否把内容发送到不明地址
写入行为	是否会修改、删除、上传本地文件
凭证处理	是否读取 API key、Cookie、Token
依赖来源	是否依赖可疑包或脚本

一个稳妥的安装顺序是：先装基础可信插件，再用 skill-vetter 审查其他插件。对于需要高权限的 SKILL，可以先在测试目录或独立环境里试运行。

15. video-frames：从视频中提取关键帧

用途：使用 ffmpeg 从视频里提取关键帧或短片段。
地址：clawhub.ai/steipete/video-frames

video-frames 适合内容分析和视频素材处理。比如要分析一个演示视频的画面变化，或者从视频中截取代表性帧做封面、笔记、报告，都可以交给它完成。

示例：

从这个视频每隔 10 秒提取一帧，并按时间命名。

提取视频中画面变化明显的关键帧，用于内容分析。

截取 00:01:20 到 00:01:45 之间的片段。

它适合处理“从视频里拿素材”的任务，不适合替代专业剪辑软件。需要复杂调色、多轨剪辑、字幕包装时，仍然应该进入视频编辑工具。

补充：web-content-fetcher，用来读取复杂网页

用途：抓取网页正文，并返回干净的 Markdown。
地址：github.com/shirenchuang/web-content-fetcher

web-content-fetcher 解决的是网页读取失败的问题。有些页面用普通抓取方式拿不到正文，例如动态渲染页面、登录后可见页面、微信公众号内容，或者 Jina Reader 读取不完整的页面。它通过多级降级策略兜底，尽量把页面正文提取成适合 AI 处理的 Markdown。

适合场景：

抓取普通网页正文；
读取需要登录状态的页面；
提取微信公众号内容；
把网页材料整理进知识库；
给 summarize、markdown-converter 等后续处理提供干净输入。

使用登录页面抓取时，要注意账号权限和隐私边界。能读取不代表应该读取，内部系统、付费内容、个人数据都要按授权范围处理。

按工作流组合安装

不同人不需要同一套 SKILL。按工作方式组合，通常比一次装满更合理。

使用人群	推荐组合	能解决的问题
内容创作	summarize、openai-whisper、video-frames、humanizer、nano-banana-pro	总结资料、转写音频、提取视频素材、润色文本、生成配图
研发人员	github、markdown-converter、summarize、skill-vetter、memory-setup	查仓库、看 PR、整理技术文档、审查插件、记录项目规则
知识管理	obsidian、markdown-converter、summarize、memory-setup、self-improving	文件转 Markdown、归档笔记、沉淀长期规则
自动化助理	proactive-agent、memory-setup、self-improving、find-skills	主动检查任务、保存偏好、积累纠错经验、发现新能力
金融研究	stock-market-pro、summarize、markdown-converter	技术指标分析、整理研报、归档数据材料

如果只想先装一组通用插件，可以从这些开始：

帮我安装这些 SKILL：
find-skills、summarize、openai-whisper、markdown-converter、skill-vetter、memory-setup

这组覆盖了插件发现、内容总结、语音转写、格式转换、安全审查和长期记忆，适合大多数人作为基础配置。

如果主要做内容处理，可以换成：

帮我安装这些 SKILL：
summarize、openai-whisper、video-frames、humanizer、nano-banana-pro、markdown-converter

如果主要做开发协作，可以使用：

帮我安装这些 SKILL：
github、summarize、markdown-converter、skill-vetter、memory-setup、self-improving

安装前的权限检查清单

SKILL 本质上是在给 AI 增加可调用工具。工具越强，越要把权限边界想清楚。

问题	为什么重要
它是否需要访问本地文件？	可能读取或修改私人资料、项目代码
它是否需要联网？	可能把输入内容发送到外部服务
它是否需要账号授权？	GitHub、Obsidian、浏览器登录状态都可能涉及敏感数据
它是否会写入文件？	自动修改 PDF、笔记、代码时可能造成误操作
它是否调用付费服务？	图片生成、外部 API 可能产生成本
它是否能自动执行任务？	主动型插件要限制删除、发送、提交等高风险动作

比较稳妥的做法是：高权限插件少装，能只读就不要给写入权限，能限制目录就不要开放整个磁盘。对于陌生 SKILL，先用 skill-vetter 检查，再在低风险环境试运行。

15 个 SKILL 速查表

#	SKILL	核心用途	更适合谁
1	find-skills	根据需求发现插件	所有 OpenClaw 用户
2	summarize	总结网页、PDF、视频、音频	内容处理、资料研究
3	openai-whisper	本地语音转文字	会议、访谈、视频字幕
4	nano-pdf	用自然语言修改 PDF	文档处理
5	nano-banana-pro	生成和编辑图片	内容创作、设计草图
6	github	在对话框里操作 GitHub	开发者
7	humanizer	清理 AI 文本模板感	写作、运营、文案
8	proactive-agent	主动检查和提醒	自动化工作流
9	obsidian	读写 Obsidian 知识库	笔记重度用户
10	memory-setup	配置长期记忆	需要稳定偏好的用户
11	stock-market-pro	股票技术指标图和报告	金融研究
12	markdown-converter	多格式转 Markdown	文档整理、知识库
13	self-improving	从纠错中沉淀规则	长期重复任务
14	skill-vetter	安装前安全审查	所有 OpenClaw 用户
15	video-frames	提取视频关键帧或片段	视频分析、内容制作
补充	web-content-fetcher	读取复杂网页并转 Markdown	网页资料抓取

OpenClaw 的 SKILL 系统最适合从小组合开始搭建。先安装能明显减少重复劳动的插件，再根据真实任务逐步扩展；每装一个高权限插件，都要确认它访问什么、修改什么、是否会联网，以及出错时能不能回滚。这样才能把 OpenClaw 用成稳定的工作台，而不是堆满插件的聊天窗口。