Toolkit de Prompt Engineering
Awesome Prompt Engineering, OpenAI Cookbook, los 27 frameworks de Prompt Architect, Prompt Master, y el subagente prompt-engineer de Claude Code.
Qué incluye este pack
Este pack reúne seis recursos de alta señal de prompt engineering y los acompaña con un subagente Claude Code que de verdad los aplica. La mezcla es deliberada: dos referencias enciclopédicas, dos colecciones opinadas de frameworks, y dos herramientas operativas que puedes meter en tu editor.
| # | Recurso | Tipo | Qué te da |
|---|---|---|---|
| 1 | Awesome Prompt Engineering | lista curada | Índice de papers, cursos, librerías |
| 2 | OpenAI Cookbook | repo de referencia | 200+ ejemplos funcionales para APIs OpenAI |
| 3 | Prompt Architect — 27 frameworks | colección | CRISPE, RACE, RICE, RTF y 23 más |
| 4 | Prompt Master | colección | Librería de patrones con ejemplos red-team |
| 5 | prompt-engineer subagente | agente Claude Code | Reescribe un prompt según el framework elegido |
| 6 | Prompt scaffolds | pack snippets | System messages reutilizables para tareas comunes |
La colección es opinada sobre el orden de operaciones: lee la awesome list para mapear el terreno, copia un framework que encaje con tu tarea, luego corre el subagente sobre tu borrador e itera.
Por qué un "toolkit" en vez de otra lista
Los resultados de búsqueda para "prompt engineering" colapsaron a las mismas cinco recomendaciones en cada página. Este pack resuelve un problema distinto: una vez que sabes lo básico, ¿a qué echas mano para mejorar?
La respuesta resultan ser tres cosas en tensión:
- Amplitud — ver cómo varían los prompts entre dominios, modelos y rarezas de provider. Awesome list y Cookbook lo cubren.
- Estructura — elegir un marco para que tus prompts sean auditables, comparables y reutilizables. Los 27 frameworks y Prompt Master lo cubren.
- Iteración — pasar de borrador N a N+1 rápido, con justificación. El subagente Claude Code lo cubre.
Tener las tres a la vez es lo que compone. Quedarte con una o dos te deja redescubriendo los mismos errores durante meses.
Instala en un comando
# Instala el pack entero
tokrepo install pack/prompt-engineering-toolkit
# O solo el subagente
tokrepo install prompt-engineer
El subagente se activa en Claude Code con un request como @prompt-engineer rewrite this prompt for clarity and falsifiability. Usa uno de los 27 frameworks (por defecto: CRISPE) y emite un diff más una sección de rationale. Las colecciones de frameworks viven bajo .claude/skills/prompt-engineering/ para referenciarlas desde cualquier sesión.
Errores comunes
- Tratar frameworks como dogma. CRISPE / RACE / RTF son andamios, no leyes. El subagente elige uno según la tarea; si su elección parece mala, sobrescribe con
--framework=<name>en vez de pelear con el output. - Saltarse la eval. Una reescritura que "se siente mejor" puede puntuar peor en tu test set real. Combina con Eval & Guardrails LLM (Promptfoo / DeepEval) para que cada cambio tenga un delta cuantificado.
- Drift de provider. Los ejemplos de OpenAI Cookbook asumen APIs OpenAI. Los equivalentes Claude / Gemini difieren en sutilezas (manejo de system message, schemas de tool use). Al portar, mira primero la doc de prompting del provider.
- Sobre-prompteo. Prompts largos esconden bugs. Si excede ~400 tokens, factoriza partes a una definición de tool o llamada de retrieval en vez de meter todo en el system message.
- Sin control de versiones. Los prompts son código. Comitéalos, diff, code-review. El subagente emite diffs precisamente para que este ciclo funcione.
Conceptos erróneos comunes
- "El prompt engineering murió porque los modelos se volvieron más listos." Lo opuesto — mejores modelos premian prompts más estructurados porque pueden seguir más constraints fiablemente. Lo que murió es el trick-prompting (frases jailbreak, palabras mágicas). El prompting estructurado vale más que nunca.
- "No necesitas esto si usas un framework como LangChain." Los frameworks componen prompts; no los escriben. Los system messages y descripciones de tool dentro de una chain LangChain siguen siendo prompts que tú autoras.
- "El OpenAI Cookbook es OpenAI-específico." Los patrones (function calling, salida estructurada, evaluadores) portan limpiamente a Claude y Gemini. Los bindings difieren; el enfoque no.
Dónde se detiene este pack
El toolkit es end-to-end para ingeniería de un solo prompt. No cubre diseño de agentes multi-paso (donde el prompt es solo un nodo en un grafo), prompting con retrieval aumentado (donde el contexto se inyecta en runtime), ni fine-tuning (donde cambias el modelo). Para cada uno, combina este pack con la adyacencia apropiada: frameworks de agente para grafos, pipelines RAG para retrieval, y recetas de fine-tuning para la capa modelo. El subagente prompt-engineer es honesto sobre su alcance — cuando le pidas "arreglar" algo que en realidad necesita RAG, te lo dirá explícitamente en vez de producir un prompt más largo que tape el hueco.
6 recursos listos para instalar
Preguntas frecuentes
¿El pack es gratis?
Sí. Cada recurso es código abierto — cinco repos GitHub más el subagente formato Anthropic. La instalación TokRepo es gratis y no introduce proxy o token. Solo pagas las llamadas a la API LLM cuando corres el subagente sobre un borrador, y eso factura contra el provider que uses (Claude, OpenAI, Gemini).
¿Cómo se compara con usar ChatGPT para reescribir prompts?
ChatGPT puede reescribir, pero elige un framework implícito y no te da rationale. El subagente prompt-engineer elige framework explícitamente, lista las constraints añadidas, y emite un diff unificado para que revises qué cambió y por qué. Eso hace la reescritura auditable y te deja rechazar elecciones específicas en vez de aceptar el bloque.
¿Funciona con Claude Code o Cursor?
El subagente es nativo Claude Code (es un archivo .claude/agents/*.md). Las colecciones de frameworks y los repos de referencia son agnósticos al lenguaje — se instalan como Markdown y los puede leer cualquier editor IA. Usuarios Cursor los referencian vía @-mentions; usuarios Codex CLI los ponen en AGENTS.md. El subagente requiere específicamente la sintaxis de invocación de agente de Claude Code.
¿Diferencia con escribir prompts a mano?
Los prompts a mano son geniales cuando ya prompteaste esa tarea exacta antes. Este toolkit brilla cuando empiezas de cero o cuando los prompts fallan de formas que no puedes articular. Los frameworks te dan vocabulario (Rol, Contexto, Especificidad, Ejemplos) para nombrar qué falta. Una vez interiorizado, puedes dejar de usar el subagente — eso es éxito, no fracaso.
¿Trampa operacional?
El error más grande es no comitear los prompts. Un cambio de prompt es un cambio de código con el mismo perfil de riesgo (regresión, drift, atribución). Trata el prompt reescrito igual que una función refactorizada: PR, review, eval, merge. El subagente emite diffs precisamente para que este flujo sea natural, no aspiracional.
12 packs · 80+ recursos seleccionados
Explora todos los packs curados en la página principal
Volver a todos los packs