Codex CLI 快速上手包
刚装好 OpenAI Codex CLI 想第一小时就出活的开发者,这十个按顺序来:Codex 本体、AGENTS.md、sandbox 运行时、MCP 官方服务器、plugin/skill 市场、zero-config 助手,外加和姊妹产品 Claude Code 互通的桥 — 全部按推荐安装顺序排好。
这个 pack 包含什么
刚跑完 npm install -g @openai/codex,敲了 codex,对着 Rust 飞起的提示符发愣 — 不知道下一步装啥。Codex 开箱即用确实强,但第一小时才是决定你出活还是关窗口的分水岭。这个 pack 就是那个主观推荐的短清单,一次解决 Codex 新手会踩的前十个问题。
Codex 是 Claude Code 的姊妹产品:两者都是终端编码 agent,都支持 Agent Skills 标准,都读一个 per-repo 的指令文件。Codex 的差异化在于CLI 体验干净利落、多模型支持、自带 sandbox 跑命令。这个 pack 顺着这个差异化走:先项目记忆(AGENTS.md),再锁死要默认安全的运行时(sandbox),再市场和助手,最后回到 Claude Code 桥做互评。
目标读者:终端能跑、有一个真实代码仓库、有 OpenAI API key(或 Codex 订阅)、零耐心按字母顺序浏览每个 plugin。装完第 10 个,你的 Codex 会懂 repo 规范、跑在真 sandbox 里、能调 MCP、需要时还能拉 Claude Code 一起 review 一个棘手 diff。
推荐安装顺序
- OpenAI Codex CLI — agent 本体 — 从这里开始。
npm install -g @openai/codex然后在任何 repo 里敲codex。Rust 基底、支持 Agent Skills 标准、多模型(GPT-5 / o 系列 / 自定义),自带 sandbox 执行。先把 session 跑起来再装其他东西 — 后面每个 pick 都是在配这个工具。 - AGENTS.md — 项目记忆文件 — 你能为 Codex 写的杠杆最高的一个文件。在 repo 根目录放一份短 markdown:开发环境提示、测试命令、PR 规范、agent 不能动的东西。Codex 每个 session 自动读。和 CLAUDE.md 同一个思路,但跨工具:Cursor / Continue / 其他 agent 都读 AGENTS.md。5 分钟填完,每周省好几小时。
- OpenAI Cookbook — 官方 prompting 指南 — Codex 的行为高度受你怎么问影响。Cookbook 有 GPT-5、Codex、meta-prompting、Realtime API 的官方 prompting 指南。开始照搬推特上随便抄的 prompt 模板之前,先扫一遍 Codex 那一节。
- MCP Reference Servers — Anthropic 官方集合 — Codex 说 MCP。把 filesystem、git、memory、fetch、sequential-thinking 这几个官方实现接上,你就解锁了 Claude Code 同款的 MCP 生态。这些是参考实现 — 小、可审计、好的起点,再去碰第三方 MCP server。
- AIO Sandbox — Docker 安全 agent 运行时 — 早早把 sandbox 方案定下来。Codex 自带 sandbox 管文件写入够用;AIO Sandbox 把整个运行时(browser + shell + files + MCP)装进容器,行为失控的 session 碰不到你的笔记本。Docker 30 秒快速启动,监听 8080。让 Codex 自动跑 shell 命令之前,先装好它。
- Awesome Codex Plugins — 精选 plugin 市场 — 社区维护的可装 plugin 集合。这是你接下来 6 个月浏览代替 grep 的索引。扫一遍,把和技术栈匹配的分类收藏,需要时再回来翻。(Codex 叫 plugin;Claude Code 叫 skill — 形状一样,打包略不同。)
- zcf — Claude Code & Codex 零配置助手 —
npx zcf i几分钟搞定 workflow、路由、MCP 接线。如果第 2-5 步觉得手动配太多,跑这个。它替你做选择,你不用想每个开关。最适合全新环境跑;不要套在你精心手调的配置上。 - Awesome QA Skills — Codex/Claude 通用测试 skill — 跨 Codex / Cursor / Claude Code 的可复用测试 skill 包。Codex 一开始写代码,你就需要每次跑法一致的测试通道。装上之后,Codex 不再悄悄留回归 bug。
- Codex Plugin for Claude Code — OpenAI 互评 — 桥。在 Claude Code 里装上这个 plugin,你可以把一个 diff 丢给 Codex 做对抗性 review,或者直接派一个子任务。两个编码 agent 看同一个问题,抓的是不同 bug。棘手 refactor 一个模型卡住时尤其有用。
- Cursor vs Claude Code vs Codex — 2026 对比 — 最后读。当你装完 Codex 和回到 Claude Code 的桥,这份指南告诉你什么场景该用哪个 agent:上下文窗口、MCP 支持、价格、sandbox 模型、agent 体验。不是选赢家 — 是搞清楚你刚才默认接受了哪些取舍。
它们怎么协同
Codex CLI (#1)
│
└─ agent 本体,读下面所有东西
│
AGENTS.md (#2)
│
└─ per-repo 记忆,每个 session 自动加载
│
OpenAI Cookbook (#3)
│
└─ Codex 真听得进去的 prompt 写法
│
MCP Reference Servers (#4)
│
├─ filesystem, git, memory, fetch
└─ 结构化访问你的环境
│
AIO Sandbox (#5)
│
└─ 容器化运行时,shell 命令逃不出去
碰不到你的 dotfiles
│
市场: Awesome Codex Plugins (#6)
│
└─ 浏览代替瞎猜
│
zcf (#7) — 可选的零配置助手
│
└─ 跳过手动配时帮你接好 #2/#4/#6
│
QA Skills (#8)
│
└─ 改动后测试,Codex 不再留回归
│
Claude Code 里的 Codex Plugin (#9)
│
└─ 互评:Codex 评 Claude 的 diff,反之亦然
│
Cursor / Claude Code / Codex 对比 (#10)
│
└─ 什么场景该用哪个 agent
Codex + AGENTS.md + AIO Sandbox 这三件套是承重墙。没有这三个,其他都是装饰。如果你只有 10 分钟,装 #1、写 20 行 #2、在让 Codex 跑 shell 之前先决定 #5 — 三件做完就停。市场浏览(#6/#8)和跨产品桥(#9)是第二周的升级。
你会遇到的取舍
- Codex CLI vs Claude Code — 两者都是终端编码 agent,都说 Agent Skills,都读 per-repo 指令文件。Codex 押 OpenAI 模型(GPT-5 / o 系列)+ 今天更干净的 sandbox 故事;Claude Code 押 Anthropic 模型 + 更深的 subagent + hooks 生态。认真用的人两个都装 — Codex 跑原始速度和 OpenAI 专属任务,Claude Code 跑编排过的长 session,用互评 plugin(#9)让它们互相挑刺。
- AGENTS.md vs CLAUDE.md — 同一个思路,不同约定。AGENTS.md 是跨工具开放格式(Codex、Cursor、Continue 等都读)。CLAUDE.md 是 Claude Code 自己的文件。只用一个 agent 就用对应原生文件。两个都用 就写 AGENTS.md 然后让 CLAUDE.md
@import它 — 单一信息源。 - Codex 自带 sandbox vs AIO Sandbox (#5) — Codex 自带的管文件写入和网络门控,进程级。AIO 把整个运行时装容器 — browser、shell、files、MCP。自己电脑上自己 repo 个人玩,自带够用。让 agent 在真机器上跑任意 shell — 尤其工作笔记本或接近生产的主机 — AIO 是该有的最低线。
- 官方 MCP server (#4) vs 第三方 MCP — 官方 server 是 Anthropic 写的、小、可审计、scope 朴素(filesystem / git / fetch)。第三方 MCP server 通常更强但代码质量参差。永远从官方开始 — 它们是其他所有 server 被对比的地板。
- zcf (#7) vs 手调 — zcf 60 秒给你 80% 的合理设置。剩下 20% 是对你 repo 才重要的部分:要哪几个 MCP server、AGENTS.md 真正该写什么、什么 sandbox 模型适合你的安全姿态。跑 zcf 搭脚手架,然后手动改通过项目 review 的部分。
常见踩坑
- 觉得 Codex「看起来够聪明」就跳过 AGENTS.md — 没有它,每个 session 都从零学你的规范。agent 会在 spaces repo 里继续打 tab,在
uv run pytest项目里跑裸pytest,编辑你已经叫前三个 session 别动的文件。30 行 markdown 永久解决。 - 在工作机上不用 sandbox 直接跑 Codex — 默认是合理的,但「合理」不等于「凌晨两点配错 prompt 也安全」。AIO Sandbox(#5)30 秒搞定,消掉一整类糟糕的一天。
- 把 AGENTS.md 写成长文 — 30–80 行是黄金区间。有人把架构文档 paste 进去,每轮 burn 几千 token。要简:技术栈、命令、规范、硬性禁忌。长篇架构丢链接文档,让 agent 按需读。
- 一次把市场(#6)里每个 plugin 都装上 — plugin 越多 = Codex 要扫的上下文越多才能路由对 = 越慢越蠢。从匹配你技术栈的四五个起步。出现真实工作流缺口再加。
- 遇到瓶颈才想起互评 plugin(#9) — 装它的正确时机是在你需要之前。错误时机是 debug 第三小时 Codex 和 Claude Code 都困在同一个错假设上、你被迫切窗口装东西只为打破死循环的时候。
10 个资产打包就绪
常见问题
用 Codex CLI 真的要先装 10 样东西?
不是 — Codex 跑完 npm install -g @openai/codex 就能直接用。这个 pack 是给之后那一刻准备的:当你发现自己每个 session 都在重复自己、纠结到底用自带 sandbox 还是 AIO Sandbox、想把那层枯燥的基础设施一次配齐再也不管。如果你还在「先在提示符里玩一小时」阶段,直接裸用 Codex。等你第三次冒出「这玩意儿早配好就好了」的念头时再回来。
只有 10 分钟的话,先装哪三个?
Codex 本体(#1)、一份 20 行的 AGENTS.md(#2)、对 sandbox 做出决定(#5 — 至少要知道你打算用自带的还是跑进 AIO Sandbox)。这三个是性价比最高的最小可用配置。剩下七个可以接下来一周慢慢加。
Codex CLI vs Claude Code — 选一个就好吗?
诚实回答:两个都装。它们重叠很多(都是终端编码 agent、都说 Agent Skills、都读 per-repo 指令文件)但不可替换。Codex 今天原始 token 吞吐快、sandbox 故事更干净、给你 OpenAI 模型。Claude Code 有更深的 subagent + hooks 生态和更长的有效上下文。互评 plugin(#9)让它们互相挑 diff — 这是真有用,不是噱头。
AGENTS.md 和 CLAUDE.md 有啥区别?
同一个思路,不同约定。AGENTS.md 是开放跨工具格式 — Codex、Cursor、Continue 等都读。CLAUDE.md 是 Claude Code 自己的文件。只用一个 agent,就用对应原生文件。两个都用,就把 AGENTS.md 当信息源,让 CLAUDE.md @import 它。别维护两份。
Codex 自带 sandbox 够用吗?还是真得装 AIO Sandbox?
自己电脑上自己 repo 个人玩,自带够用 — 进程级门控文件写入和网络。AIO Sandbox 把整个运行时(browser / shell / files / MCP)装容器,最坏情况的 prompt 也碰不到你的 dotfiles、SSH key、云凭证。工作笔记本或接近生产的环境,30 秒 Docker 搭起来值。周末写副业项目,自带就行。