Prompt 工程工具箱
Awesome Prompt Engineering / OpenAI Cookbook / Prompt Architect 27 框架 / Prompt Master + Claude Code prompt-engineer subagent。
这个 pack 装了什么
这个包凑齐了六个高信号的 prompt 工程资产,并配一个真的会用它们的 Claude Code subagent。组合是有意的:两个百科级参考,两个有立场的框架合集,两个能直接放进编辑器跑的工具。
| # | 资产 | 类型 | 给你什么 |
|---|---|---|---|
| 1 | Awesome Prompt Engineering | 精选列表 | 论文 / 课程 / 库的索引 |
| 2 | OpenAI Cookbook | 参考仓 | 200+ OpenAI API 的可跑示例 |
| 3 | Prompt Architect — 27 框架 | 框架合集 | CRISPE / RACE / RICE / RTF 等 27 个 |
| 4 | Prompt Master | 框架合集 | 模式库带红队示例 |
| 5 | prompt-engineer subagent | Claude Code agent | 按选定框架重写 prompt |
| 6 | Prompt 脚手架 | 片段包 | 常见任务的可复用 system message |
整个集合对操作顺序有立场:先读 awesome 列表摸清地图,挑一个适合任务的框架,然后用 subagent 跑你的草稿迭代。
为什么叫"工具箱"而不是又一份长列表
"prompt engineering"的搜索结果已经塌缩成每个页面同样的五条 tip。这个 pack 解决另一个问题:你已经会基本功之后,靠什么变得更强?
答案是三件事拉扯:
- 广度 —— 看 prompt 在不同领域 / 模型 / provider 怪癖下怎么变化。Awesome 列表和 Cookbook 覆盖
- 结构 —— 选一个框架让 prompt 可审计 / 可对比 / 可复用。27 框架合集和 Prompt Master 覆盖
- 迭代 —— 从第 N 版到 N+1 版要快,要有理由。Claude Code subagent 覆盖
三件同时拥有才会复利。只占一两件,会让你接下来几个月反复踩同样的坑。
一条命令装齐
# 装整个 pack
tokrepo install pack/prompt-engineering-toolkit
# 或者只装 subagent
tokrepo install prompt-engineer
Subagent 在 Claude Code 里收到 @prompt-engineer rewrite this prompt for clarity and falsifiability 之类请求时激活。它默认用 CRISPE,输出 diff 加 rationale。框架合集存在 .claude/skills/prompt-engineering/ 下,任何会话都可以引用。
常见坑
- 把框架当圣经:CRISPE / RACE / RTF 是脚手架,不是法律。Subagent 按任务挑一个;觉得选错了就用
--framework=<name>强制覆盖,不要跟输出较劲 - 跳过评测:感觉更好的改写可能在你真实测试集上更差。配合 LLM 评测 & 护栏(Promptfoo / DeepEval),让每次改动都有量化 delta
- provider 漂移:OpenAI Cookbook 示例假设 OpenAI API。Claude / Gemini 等价物在细节上不同(system message 处理 / 工具 schema)。移植时先看 provider 官方 prompting 文档
- over-prompting:长 prompt 藏 bug。一条 prompt 超过 ~400 token 时,把部分拆到工具定义或检索调用,不要全塞进 system message
- 不进版本管理:prompt 就是代码。commit / diff / code review 一样不少。Subagent 输出 diff 就是为了让这个生命周期跑得顺
常见误解
- "模型变聪明了,prompt engineering 死了。" 反过来 —— 越好的模型越奖励结构化 prompt,因为它能可靠遵循更多约束。死掉的是奇技淫巧(越狱咒语 / 魔法词)。结构化 prompt 比以前更值钱
- "用了 LangChain 这种框架就不需要这个。" 框架是组合 prompt,不是写 prompt。一条 LangChain chain 里的 system message 和 tool description 还是你要写的 prompt
- "OpenAI Cookbook 只对 OpenAI 有用。" 模式(函数调用 / 结构化输出 / 评估器)能干净地移到 Claude / Gemini。绑定不同,方法相同
6 个资产打包就绪
常见问题
这个 pack 免费吗?
免费。每个资产都开源 —— 五个 GitHub 仓加上 Anthropic 格式的 subagent。TokRepo 安装免费,不引入代理或 token。你只在真用 subagent 跑草稿时为 LLM API 调用付费,账单走你用的 provider(Claude / OpenAI / Gemini)。
跟用 ChatGPT 重写 prompt 有啥区别?
ChatGPT 可以重写,但它会隐式选个框架,不给你 rationale。prompt-engineer subagent 显式选框架,列出加了哪些约束,输出 unified diff,让你能审查改了啥、为啥改。改写就变得可审计,可以拒绝单个选择,而不是整团接受。
Claude Code / Cursor 都能用吗?
Subagent 是 Claude Code 原生(一个 .claude/agents/*.md 文件)。框架合集和参考仓是语言无关的 —— 装成 Markdown,任何 AI 编辑器都能读。Cursor 用户一般通过 @-mention 引用,Codex CLI 用户放进 AGENTS.md。Subagent 必须要 Claude Code 的 agent 调用语法。
跟手写 prompt 比有啥不同?
手写在你以前 prompt 过这个任务时挺好。这个 toolkit 在你从零起步、或 prompt 出问题但说不清哪儿不对时发光。框架给你词汇(角色 / 上下文 / 具体性 / 示例)来命名缺什么。等你内化了可能就不用 subagent 了 —— 这是成功,不是失败。
运维坑?
团队最大的错是不把 prompt 进版本管理。Prompt 改动是代码改动,风险等级一样(回归 / 漂移 / 归因)。把改后的 prompt 当作重构的函数对待:PR / review / eval / merge。Subagent 输出 diff 就是为了让这个工作流自然而非空想。