芥末
发布于 2026-05-16 / 0 阅读
0
0

Codex 桌面 Agent 入门:项目、权限、插件、Skills 与自动化任务

Codex 是 OpenAI 推出的桌面 Agent。它不只是一个聊天窗口,而是一个能在电脑上工作的智能体:你给它任务,它可以读取项目文件、创建文件、运行终端命令、调用浏览器、连接外部服务,甚至把重复流程设置成定时自动执行。

普通 ChatGPT 更像“问答助手”,你问什么,它回答什么;Codex 更像“可授权的执行助手”,它可以在你允许的范围内真正改动本地环境。

flowchart LR
    U[用户用自然语言下任务] --> C[Codex Agent]
    C --> M[大模型推理与规划]
    M --> F[本地文件读写]
    M --> S[终端命令]
    M --> B[浏览器/电脑操控]
    M --> P[插件与外部服务]
    M --> K[记忆与 Skills]
    F --> R[任务结果]
    S --> R
    B --> R
    P --> R
    K --> R
    R --> U

它适合处理两类工作:

工作类型例子Codex 的价值
本地文件整理批量重命名、整理素材、生成文档、转换格式能直接读取和修改电脑上的项目文件
开发与部署初始化网页、安装依赖、运行项目、部署到平台能执行命令并根据报错继续修复
外部平台操作写飞书文档、操作 GitHub、部署 Netlify、浏览器填表通过插件或 CLI(Command Line Interface,命令行界面)连接外部服务
重复流程自动化定期生成周报、定时抓取数据、周期性发布内容能结合 Skills 和自动化任务定时执行

Codex 和 Claude Code 的关系

Codex 和 Claude Code 都属于编程 Agent 起家的桌面工具。它们的核心思路非常接近:让大模型不再只回答问题,而是可以使用工具完成任务。

维度CodexClaude Code
背后厂商OpenAIAnthropic
常见入口ChatGPT 账号、Codex 桌面端Claude 账号、Claude Code
核心能力本地文件、终端、插件、浏览器操控、Skills、MCP、自动化本地文件、终端、Skills、MCP、斜杠命令、Hook 等
使用体验和 ChatGPT 生态结合紧密,适合从日常办公逐步进入 Agent 工作流更偏开发者习惯,写作和规划能力也很强
学习迁移学会项目、权限、工具调用、记忆、Skills 后,迁移成本很低同样遵循“给上下文、定目标、验结果”的 Agent 工作方式

如果只准备先学一个,Codex 已经足够覆盖大量日常工作和轻量开发场景。真正需要长期使用 Agent 时,重点不是记住某个按钮在哪里,而是理解这类工具的共同工作方式:准备上下文、授权工具、检查计划、验收输出。

安装与基础准备

使用 Codex 需要一个 ChatGPT 账号。免费账号也能体验,只是额度更少;Plus、Pro 等付费账号通常有更高的使用上限。

官方入口:

https://chatgpt.com/zh-Hans-CN/codex/get-started/

安装流程从官网开始,登录 ChatGPT 账号后按引导下载桌面端即可。

Codex 官方安装入口

安装页会引导你选择使用场景,例如日常工作、开发、学习等。这里的选择不会锁死后续能力,后面仍然可以调整设置。

进入桌面端后,界面通常由几块组成:

  • 左侧:对话、任务、项目、插件、自动化等入口;
  • 中间:和 Codex 对话的主区域;
  • 右侧:文件、运行结果、预览浏览器或任务输出;
  • 底部或输入区:模型、语音、斜杠命令、计划模式等操作入口。

核心概念:项目就是 Codex 的工作目录

Codex 处理本地文件时,会围绕“项目”工作。项目本质上对应电脑上的一个文件夹,Codex 被授权后,可以在这个文件夹里读取、创建、修改、删除、移动文件。

这个设计很重要,因为它决定了 Codex 能看到什么、能改什么。

flowchart TD
    A[选择一个本地文件夹] --> B[创建或进入 Codex 项目]
    B --> C[文件夹内容成为上下文来源]
    C --> D[Codex 读取文件]
    C --> E[Codex 写入新文件]
    C --> F[Codex 修改或移动文件]
    C --> G[Codex 执行项目内命令]

举个例子,假设有一个视频素材文件夹,里面有几十个 .mp4 文件,名字全是随机字符串。你可以直接让 Codex 按视频内容重命名:

把当前文件夹里的所有视频素材按实际内容重新命名。

要求:
1. 保留原来的序号,方便回溯;
2. 文件名包含人物、场景、动作三个信息;
3. 不要改变视频格式;
4. 重命名前先列出计划,确认后再执行。

Codex 可能会先统计文件数量,再抽取关键帧,通过缩略图或画面内容判断素材主题,然后批量改名。对于这类任务,普通聊天机器人拿不到你的本地文件,自然无法完成;Codex 的优势就在于它能把本地文件夹当成工作空间。

权限模式:让 Agent 能做事,也要控制边界

Codex 能操作本地文件和终端,所以权限一定要理解清楚。界面里会提供不同权限模式,通常越保守的模式确认越多,越开放的模式执行越流畅。

Codex 权限模式选择

权限设置决定了 Codex 在什么情况下需要向你确认。安全使用时,可以按任务风险选择:

任务建议权限策略原因
阅读文件、生成摘要可用较宽松权限主要是读操作,风险较低
批量重命名、转换格式先让它列计划,再授权执行涉及文件改动,最好确认规则
删除、覆盖、移动大量文件必须人工确认一旦误删,恢复成本高
安装软件、改环境变量、修改系统目录谨慎授权可能影响全局环境
使用外部账号发消息、发布内容、部署上线执行前确认目标账号和输出内容避免发错位置或发布未检查内容

比较稳妥的做法是:先把任务限制在一个明确的项目文件夹里,再让 Codex 工作。不要一开始就把整个桌面、下载目录或系统目录交给它。

对于有风险的任务,可以这样下指令:

先不要执行任何修改。请先扫描项目,列出你准备修改的文件、修改原因和具体操作。
我确认后,你再开始执行。

本地文件操作:让文件夹成为上下文

Codex 的第一个高频能力,就是本地文件操作。它不仅能读取单个文件,还能处理整个文件夹。常见任务包括:

  • 批量重命名;
  • 整理目录结构;
  • 从图片、视频、文档中提取信息;
  • 生成 Markdown、PDF、PPT 等文件;
  • 修改代码、配置、文案;
  • 把多个文件合并或拆分;
  • 根据已有文件生成说明文档。

文件处理任务一般可以拆成四步:

sequenceDiagram
    participant U as 用户
    participant C as Codex
    participant F as 项目文件夹
    participant T as 工具/命令

    U->>C: 描述目标和约束
    C->>F: 扫描文件结构
    C->>T: 必要时调用 ffmpeg、脚本或系统命令
    T-->>C: 返回识别或处理结果
    C->>U: 给出执行计划
    U->>C: 确认执行
    C->>F: 修改、生成或移动文件
    C-->>U: 返回结果和变更说明

如果要处理视频素材,提示词最好写得具体一些:

请整理这个视频素材文件夹。

目标:
- 按画面内容给每个视频重新命名;
- 命名格式为:序号-人物-场景-动作;
- 文件名使用中文;
- 不改变原视频内容;
- 如果无法判断内容,请在文件名里标记“待确认”。

执行前先输出重命名映射表,我确认后再修改文件。

这样做有两个好处:一是 Codex 不会直接盲改;二是你可以先检查“原文件名 -> 新文件名”的映射,发现偏差再纠正。

多对话与并行任务

同一个项目下可以开多个对话。每个对话可以负责不同任务,例如:

  • 对话 A:整理素材;
  • 对话 B:生成剪辑脚本;
  • 对话 C:把风景视频拼成合集;
  • 对话 D:根据素材生成发布文案。

这类并行方式很适合把一个大任务拆开处理。需要注意的是,不同对话如果同时修改同一批文件,可能发生冲突。比较安全的分工方式是让每个对话操作不同文件夹,或者先让 Codex 创建副本:

请先把待处理文件复制到 output/workspace 目录里,所有修改都在副本上完成,不要改动原始素材。

上下文窗口与压缩

Codex 每次对话都会消耗模型上下文窗口。上下文可以理解为模型当前“记得住”的信息范围,包括聊天记录、文件摘要、工具返回结果、计划、报错等内容。

界面里的小圆圈会显示当前对话占用了多少上下文。

Codex 上下文占用提示

上下文快满时,Codex 会自动压缩,把前面的对话总结成更短的信息继续带入。任务阶段性完成后,也可以手动使用斜杠命令压缩上下文,例如输入 / 后选择压缩相关命令。

手动压缩适合这些场景:

场景为什么要压缩
一个任务已经完成,准备开始新任务减少旧细节干扰
对话很长,模型开始遗漏要求让模型重新聚焦关键目标
调试过程产生大量报错日志保留结论,丢掉冗余中间过程
项目已经稳定,准备进入下一阶段把“当前状态”作为新的起点

除了上下文占用,还可以在状态面板里查看 5 小时额度、一周额度等使用情况。

Codex 状态面板

状态面板适合长任务开始前检查,尤其是部署、批量处理、多轮开发这类容易消耗额度的任务。额度紧张时,可以降低思考强度、减少无关文件读取,或者把任务拆小。

模型、速度与语音输入

Codex 通常会提供模型选择、速度选择和智能程度设置。可以按任务复杂度选择:

任务类型推荐设置
简单文件整理、格式转换普通速度、中等智能
安装依赖、修复环境问题中等智能起步,遇到复杂报错再提高
架构设计、复杂代码修改更高智能程度
紧急短任务可以使用更快速度,但通常更耗额度
大量描述性输入使用语音输入,再让 Codex 整理需求

语音输入很适合说需求,但说完后最好让 Codex 先复述任务:

请先把我的需求整理成任务清单,不要执行。确认我没遗漏后再开始。

这样可以避免语音识别错误直接变成错误操作。

命令行能力:让 Codex 安装、运行和修复工具

Codex 的第二个核心能力是使用终端。只要你授权,它就可以运行命令,安装依赖,启动项目,查看报错,并根据结果继续处理。

常见任务包括:

  • 安装 Node.js、Git、ffmpeg 等常用工具;
  • 初始化前端或后端项目;
  • 安装 CLI 工具;
  • 运行测试;
  • 启动本地服务;
  • 根据日志修复报错;
  • 卸载或更新软件。

例如可以直接说:

请帮我检查当前电脑是否安装了 Node.js 和 Git。
如果没有,请安装稳定版本。
安装后用命令验证版本,并告诉我安装位置。

Codex 可能会执行类似检查命令:

node -v
npm -v
git --version

如果缺少依赖,它会根据系统环境选择安装方式。Mac 上可能使用 Homebrew,Windows 上可能引导下载安装包或使用包管理器。关键不在于你记住每条安装命令,而是让 Codex 做完后必须验证:

安装完成后请运行验证命令,并输出结果。
如果安装失败,请根据报错继续排查。

安装 Agent、CLI 和开发工具

很多现代工具都会提供 CLI,让 Agent 可以更容易操作。比如某些知识库、办公平台、部署平台、开发工具,都可能有对应命令行入口。

如果工具很常见,可以直接让 Codex 搜索并安装:

最近有一个叫 Hermes 的 Agent 工具,请帮我确认它的官方仓库或官网,
然后按官方文档安装。安装完成后运行一次验证命令。

如果工具比较小众,最好把官方地址发给 Codex:

请根据这个仓库的 README 帮我安装工具:
https://github.com/example/example-cli

要求:
1. 只按官方文档操作;
2. 遇到需要全局安装的命令先问我;
3. 安装后运行示例命令验证。

对于 IDE(Integrated Development Environment,集成开发环境)或代码编辑器,Codex 也可以帮你下载安装。由于 Codex 主要通过对话和工具修改文件,不一定适合直接像编辑器那样手动逐行编辑,所以搭配 Cursor、VS Code、Antigravity 这类编辑器会更舒服。

持久记忆:agents.md 和自动记忆

Codex 的记忆分为两类:手动规则和自动记忆。

手动规则通常通过 agents.md 表达。它可以告诉 Codex:你偏好的语言、输出格式、项目规则、代码风格、禁止事项等。

全局 agents.md

全局规则适用于所有项目,适合写长期偏好。例如:

# 全局工作规则

- 始终使用中文回答。
- 修改文件前先说明计划,涉及删除或覆盖时必须等待确认。
- 写代码时优先保持项目现有风格,不随意引入新框架。
- 输出文档时使用 Markdown。
- 如果任务信息不足,先提出关键问题,不要直接假设。

全局规则适合放通用要求,不适合放某个项目的细节。否则 Codex 在其他项目里也会带入这些信息,反而容易干扰。

项目级 agents.md

项目级 agents.md 只在当前项目里生效,适合写项目背景和协作规范。例如个人主页项目可以这样写:

# 项目说明

这是一个个人主页项目,用于展示个人简介、作品、联系方式和项目经历。

# 技术约束

- 保持静态站点结构简单。
- 样式优先使用已有 CSS,不随意引入大型 UI 框架。
- 图片资源放在 assets/images 目录。
- 修改页面后需要启动本地预览并检查效果。

# 内容风格

- 文案简洁,不使用夸张营销语。
- 页面结构包括:首页、项目展示、关于我、联系方式。

当项目已经有一些文件后,可以让 Codex 先理解项目,再自动生成项目级规则:

请阅读当前项目结构和已有文件,帮我生成一个项目级 agents.md。
要求包含项目目标、目录说明、代码风格、修改注意事项和部署流程。

自动记忆

自动记忆是实验性能力。开启后,Codex 会在对话结束、任务完成或闲置一段时间后,把有价值的信息总结成记忆。之后遇到相关任务,它会自动召回。

自动记忆适合保存“曾经发生过什么”,但明确规则仍然建议写进 agents.md。原因很简单:agents.md 可控、可审查、可版本化;自动记忆更像后台摘要,不适合承载严格规范。

计划模式:复杂任务先讨论,再执行

做网站、重构代码、批量整理资料这类任务,直接让 Codex 开始干,很容易中途跑偏。计划模式可以先把需求整理成方案,确认后再执行。

Codex 计划模式入口

计划模式适合这些任务:

任务为什么适合计划模式
从零创建个人主页需要先确定页面结构、技术方案和视觉风格
重构代码项目需要知道影响范围,避免改坏已有功能
批量处理文件需要确认命名规则、输出目录和备份方式
部署上线需要确认平台、账号、构建命令、域名等
写长期自动化流程需要把触发时间、输入、输出和异常处理定义清楚

例如创建个人主页,可以这样开头:

我想做一个个人主页。请先进入计划模式,暂时不要写代码。
你需要先问我必要问题,然后整理出页面结构、技术方案、文件结构和执行步骤。

如果你还没想清楚,Codex 可以通过问题帮你补全需求,例如:

  • 页面包含哪些模块;
  • 是否需要头像或插图;
  • 使用什么风格;
  • 是否需要响应式布局;
  • 是否要部署上线;
  • 是否已有域名。

确认方案后再让它执行,成功率会高很多。

执行中纠偏与 Fork

Agent 做复杂任务时,最怕一条错误路线跑到底。Codex 支持执行中补充意见:你可以在它运行时继续输入纠偏内容,Codex 会在合适的工具调用节点接收新指令,而不是马上粗暴中断。

例如生成个人主页时,如果发现图片风格不合适,可以直接补充:

刚才生成的头像插图偏卡通了,请改成更简洁的科技感线条风。
不要重新初始化项目,只替换图片资源和相关引用。

Fork 则适合从某个历史回复分出新对话。假设前面需求讨论得很好,但后面执行方向跑偏了,可以从计划确认处 Fork,保留前面的高质量上下文,重新选择另一条路线。

这两个功能的意义是减少返工:不必每次都从空白对话重新讲背景。

内置预览浏览器与页面批注

Codex 做网页项目时,可以在右侧打开内置预览浏览器,直接查看当前页面效果。

预览浏览器还有一个实用能力:对页面元素做批注。你可以选中某个按钮、图片、标题或布局区域,直接告诉 Codex 怎么改。

Codex 页面批注功能

这种“点哪里改哪里”的方式,比用文字描述“左上角那个有点大的区域”准确得多。适合修改:

  • 图片尺寸;
  • 文案位置;
  • 按钮样式;
  • 卡片间距;
  • 移动端布局;
  • 颜色和字体。

批注时尽量写清楚目标,而不是只说“不好看”:

把这个项目卡片的标题字号调小一些,卡片上下间距增加 8px。
保持整体配色不变。

图片生成:把素材直接放进项目

Codex 可以调用图片生成能力,为项目生成插图、头像、背景图、图标等资源。它的价值不在于单独生一张图,而是可以把图片生成、文件保存、页面引用、预览检查串成一条工作流。

创建个人主页时,可以这样要求:

请为个人主页生成一张科技感头像插图,并保存到 assets/images/avatar.png。
生成后把首页头像替换为这张图,并启动预览让我检查。

如果图片不满意,可以继续迭代:

请保留构图,但把颜色改成深蓝和银灰,减少卡通感,适合技术博客主页。

在项目里使用图片生成时,最好要求 Codex 同步做三件事:

  1. 生成图片文件;
  2. 把图片放入约定目录;
  3. 修改页面引用并预览检查。

插件:连接外部平台和服务

Codex 的插件用于连接外部工具、平台和服务。它们让 Agent 不只在本地工作,还能操作部署平台、浏览器、GitHub、办公工具等。

插件页面可以看到已启用和可安装的插件。

Codex 插件页面

插件大致可以分成三类:

插件类型作用典型场景
部署与开发平台连接 GitHub、Vercel、Netlify 等上传代码、部署网站、查看构建结果
浏览器操控打开网页、点击、填写表单、截图网页测试、后台操作、资料收集
办公与外部服务连接文档、表格、消息、知识库等写文档、建日历、发消息、查资料

部署个人主页时,可以启用 GitHub 和 Netlify 或 Vercel 插件,然后直接说:

请把当前个人主页项目部署到 Netlify。
执行前先检查项目是否能本地构建,确认构建命令和发布目录。
部署完成后返回访问链接。

部署任务里最容易出问题的是构建命令、发布目录和账号授权。Codex 通常会根据项目类型判断,但你仍然要检查最终链接是否能访问。

Browser Use、Chrome 和 Computer Use

Codex 的操控类插件有几个容易混淆的入口:Browser Use、Chrome、Computer Use。

Codex 操控类插件

它们的区别可以这样理解:

能力操控对象特点适合场景
Browser UseCodex 新开的浏览器独立窗口,适合让 Agent 自己浏览和操作网页网页调研、表单测试、截图
Chrome 插件你已登录的 Chromium 浏览器可以使用现有登录态,有些操作可在后台执行操作已登录后台、网页工作台
Computer Use整台电脑界面不限浏览器,可以操作本地 App;目前系统支持有限跨应用操作、桌面自动化

浏览器操控类任务要写清楚边界,尤其是涉及登录账号、发送消息、提交表单、付款、删除内容时:

你可以打开网页并填写草稿,但不要点击最终提交按钮。
填好后停下来,让我检查。

Skills:把成熟流程沉淀成可复用能力

Skill 可以理解为“给 Agent 的行动手册”。它不是一次性的提示词,而是把某类任务的流程、规则、工具和输出格式沉淀下来,让 Codex 以后遇到类似任务时按固定方法执行。

适合做成 Skill 的任务通常有三个特点:

  1. 经常重复;
  2. 步骤相对固定;
  3. 对输出格式有明确要求。

例如“GitHub 热门项目推荐”就很适合做成 Skill。它可能包含这些规则:

# GitHub 热门项目推荐 Skill

## 目标
定期筛选 GitHub 热门项目,生成适合发布的图文推荐内容。

## 输入
- 时间范围:最近 7 天
- 技术方向:AI、开发工具、前端、后端
- 输出语言:中文

## 流程
1. 搜索指定时间范围内增长较快的项目。
2. 过滤掉低质量、无 README、无明确许可证的项目。
3. 阅读项目简介、README、示例和 star 增长情况。
4. 按“项目解决什么问题、核心功能、适合谁用、上手方式”整理。
5. 生成 Markdown 版本和社交媒体短版。

## 输出格式
- 标题
- 项目链接
- 一句话介绍
- 核心功能
- 使用场景
- 安装或体验方式
- 注意事项

创建 Skill 有两种方法:

方法做法适合情况
先讨论再创建直接告诉 Codex 你要什么 Skill,让它帮你设计你已经知道流程大概是什么
先跑通再沉淀先用普通对话完成一次任务,再让 Codex 总结成 Skill更推荐,规则来自真实执行过程

第二种通常更稳,因为它把实际踩过的坑和有效步骤都沉淀进去了:

刚才这个任务流程效果不错。请把它整理成一个可复用的 Skill。
要求包含适用场景、输入参数、执行步骤、质量检查清单和输出格式。

MCP:连接外部知识和工具

MCP(Model Context Protocol,模型上下文协议)是一种让 Agent 连接外部工具和数据源的协议。通过 MCP,Codex 可以接入某些知识库、数据库、文档系统或工具服务。

Codex 的 MCP 配置入口在设置里的 MCP 服务器区域。对新手来说,手动填写配置并不直观,更简单的方法是把 MCP 服务的官方链接交给 Codex:

请根据这个 MCP 服务的官方文档帮我配置:
https://example.com/example-mcp

要求:
1. 解释需要哪些授权;
2. 不要保存明文密钥到项目仓库;
3. 配置完成后运行一个最小测试。

MCP 和插件有些重叠,但侧重点不同:

能力更像什么适合做什么
插件Codex 内置或平台化连接器部署、浏览器、GitHub、常见外部服务
MCP标准化外部工具协议接入特定知识库、工具服务器、企业内部服务
CLI本地命令行工具本机脚本、批处理、开发工具链

如果一个平台同时提供插件、MCP 和 CLI,优先选择最稳定、授权最清晰、最容易验证的方式。

自动化定时任务:让 Agent 周期性工作

定时提醒本身不稀奇,Codex 自动化的价值在于:它可以把文件、命令、插件、Skills 组合起来,按时间或规则周期性执行。

例如,每周一早上 9 点自动生成一份 GitHub 热门项目推荐,并保存到指定文件夹:

请创建一个自动化任务:
每周一早上 9 点执行“GitHub 热门项目推荐”Skill,
生成一份 Markdown 文档,保存到 weekly-reports 目录。
执行完成后把摘要发给我确认,不要自动发布。

自动化面板里可以新建任务,填写提示词、触发时间、模型和思考强度。

Codex 自动化任务创建界面

自动化任务创建前,最好先把一次手动流程跑通。否则自动化只会定时重复一个不稳定流程。

自动化任务建议包含这些字段:

字段示例
触发时间每周一 09:00
输入来源GitHub Trending、指定知识库、项目文件夹
执行 SkillGitHub 热门项目推荐
输出位置weekly-reports/YYYY-MM-DD.md
失败处理保存错误日志并通知用户
人工确认发布前必须确认

比较安全的自动化原则是:可以自动生成,不要默认自动发布;可以自动准备,不要默认自动删除;可以自动填写,不要默认自动提交。

手机控制 Codex

手机端 ChatGPT 可以连接电脑上的 Codex。设置完成后,你可以在手机上给电脑下发任务,让 Codex 在桌面端执行。

手机端 ChatGPT 里的 Codex 入口

典型设置流程是:

  1. 手机端 ChatGPT 更新到新版本;
  2. 电脑端 Codex 更新到新版本;
  3. 在手机 ChatGPT 侧边栏进入 Codex;
  4. 按提示在电脑上允许这台手机控制这台电脑;
  5. 如果有多台电脑,可以分别绑定。

这个能力适合远程下发耗时任务,例如:

请在家里那台电脑上打开个人主页项目,检查 Netlify 部署是否正常。
如果构建失败,请定位原因并给出修复计划,先不要直接改代码。

手机控制虽然方便,但更要注意权限。远程下发任务时,尽量避免让 Codex 执行高风险操作,比如删除文件、发布内容、修改系统设置。

一套更稳的 Codex 工作流

把 Codex 当成 Agent 使用时,不要只追求“一句话让它全做完”。更稳定的方式是把任务拆成几个阶段。

flowchart TD
    A[说明目标] --> B[提供上下文]
    B --> C[让 Codex 制定计划]
    C --> D{人工确认}
    D -- 不通过 --> C
    D -- 通过 --> E[授权执行]
    E --> F[查看中间结果]
    F --> G{是否跑偏}
    G -- 是 --> H[纠偏或 Fork]
    H --> E
    G -- 否 --> I[验收结果]
    I --> J[沉淀 agents.md 或 Skill]
    J --> K[必要时设置自动化]

可以把常用提示词整理成模板。

文件整理模板

请整理当前项目文件夹。

目标:
- 按用途重新分类文件;
- 不删除任何文件;
- 所有输出放到 output 目录;
- 执行前先给出目录规划和文件移动清单。

确认后再执行。

安装工具模板

请帮我安装并配置这个工具:{工具名称或官方链接}

要求:
1. 先确认我的系统环境;
2. 只使用官方文档推荐的安装方式;
3. 需要管理员权限或全局安装时先问我;
4. 安装完成后运行验证命令;
5. 把安装过程和常用命令写到 docs/setup.md。

项目开发模板

请在当前项目中实现这个功能:{功能描述}

要求:
1. 先阅读项目结构;
2. 说明会修改哪些文件;
3. 不引入不必要的新依赖;
4. 修改后运行测试或本地预览;
5. 最后总结变更内容和验证结果。

自动化任务模板

请创建一个自动化任务:{任务目标}

触发规则:
- 时间:{触发时间}
- 输入:{输入来源}
- 输出:{输出位置}
- 失败处理:保存日志并提醒我
- 人工确认:涉及发布、删除、提交时必须暂停等待确认

常见坑和处理方法

问题表现处理方法
授权范围太大Codex 可能扫描过多无关文件只选择任务相关文件夹作为项目
任务描述太模糊输出不符合预期先让 Codex 复述需求并列计划
直接让它批量删除误删风险高改为移动到备份目录,确认后再删除
上下文太长模型遗漏早期要求阶段性压缩,重要规则写进 agents.md
自动化过早定时重复错误流程先手动跑通,再沉淀 Skill,再自动化
插件授权混乱操作错账号或错平台每次执行前确认账号、目标空间和输出位置
命令行安装失败环境变量、权限、版本冲突让 Codex 读取报错日志并逐步验证
生成内容直接发布可能带有错误或不合适表达自动生成后人工确认,再发布

Codex 的正确使用姿势

Codex 的重点不是“会聊天”,而是“能被管理”。你需要给它清晰目标、足够上下文、可控权限和验收标准。

更像这样:

你是执行者,我负责确认方向。
先理解项目,再提出计划。
涉及文件修改、发布、删除、安装时,先等待确认。
每完成一个阶段,告诉我做了什么、结果在哪里、还剩什么问题。

当某个流程跑通后,把规则写进 agents.md;当某类任务经常重复,把它沉淀成 Skill;当 Skill 足够稳定,再设置成自动化任务。这样 Codex 才不只是一个临时助手,而会逐步变成一套可复用的个人工作系统。


评论