TOKREPO · 主题包

稳定

Agent 上线模板包

10 件套，给真正把 AI agent 推到生产的开发者：FastAPI agent 骨架（Agno、PydanticAI）+ Serverless 目标（Modal、Replicate）+ 沙箱运行时（E2B、Daytona）+ 状态存储和队列（Upstash、LangGraph）+ Kubernetes 部署目标 — 按顺序串起来，agent 才能熬过头 1000 个真实请求。

10 个资产

关于这个主题包

这个 pack 包含什么

这是一个真正的工程师在 agent 上线前那一周会装的套件 — 不是上线后第一个 OOM 把服务打挂时通宵抢救的那种。每个都是字面意义上的「部署模板」：clone 一个 repo、配几个 env、你就拿到一个能并发处理请求、能持久化状态、能沙箱执行不可信代码、进程挂了能恢复的 agent。开源优先、便宜，每层都能跟下一层串起来。

#	工具	层	干什么
1	Agno	agent 骨架（FastAPI）	生产级 agent runtime，FastAPI 起服务、sessions、集成现成
2	PydanticAI	agent 骨架（类型优先）	类型安全的 agent 框架 — Pydantic model 当 I/O 契约
3	Modal Sandboxes	serverless 沙箱	在隔离的云沙箱里执行 agent 生成的代码
4	modal-examples	serverless 模板	Modal 上 Serverless LLM 任务的参考 repo
5	Replicate Cog	serverless 模板（容器）	一份 YAML → 一个带 HTTP + Webhook 的容器化模型
6	E2B	沙箱运行时	AI 生成代码的安全云沙箱 — Python/JS SDK
7	Daytona SDK	沙箱运行时	可编程的开发沙箱 — 支持快照、可重现工作区
8	Upstash（Redis + Kafka）	状态存储 + 队列	Serverless Redis 装 session，Kafka 当工作队列
9	LangGraph	有状态 agent 图	把 agent 写成显式状态 + checkpoint 的图
10	Agent Sandbox on Kubernetes	部署目标	在 k8s 上安全跑 agent 的模式 + manifest

各部分怎么拼起来

[客户端]
   │  HTTP /run
   ▼
[FastAPI agent 骨架]   ← Agno 或 PydanticAI
   │
   ├─ session/cache  ──▶  Upstash Redis
   │
   ├─ 后台任务       ──▶  Upstash Kafka  ──▶  worker（同镜像）
   │
   ├─ 工具: run_code ──▶  E2B / Daytona / Modal Sandbox
   │
   ├─ 图状态         ──▶  LangGraph checkpointer (Redis)
   │
   ▼
[部署目标]  ── Modal @asgi_app  /  Replicate Cog  /  k8s (Agent Sandbox)

四件套组合 骨架 + 状态存储 + 沙箱 + 部署目标 是「最小可行生产 agent」。少哪一个都顶不过一周：没状态 → 用户骂失忆；没沙箱 → 幻觉调出的 rm -rf 干掉你的服务；没骨架 → 你又写了一遍 FastAPI 中间件还写得不如别人；没部署目标 → 你根本接不到流量。

你会遇到的取舍

Agno vs PydanticAI — Agno 是更大的框架，sessions / FastAPI app / 集成 / tracing 现成；代价是你得忍受它的主张。PydanticAI 更小更类型优先，HTTP 那层你自己拼。两周要上线的团队 → Agno。已经有 FastAPI 约定的团队 → PydanticAI。
E2B vs Daytona vs Modal Sandbox — E2B 是最低门槛的临时代码执行沙箱（Python SDK，默认安全）。Daytona 长项是需要持久化、可快照的工作区（长生命周期的 coding agent）。Modal Sandbox 是「你已经在 Modal」的最优解 — 同 auth、同账单、跟模型调用同机房延迟最低。
Modal vs Replicate Cog vs k8s — Modal 缩到零、按秒计费、Python 即部署单元；脉冲流量最划算。Replicate Cog 是一个容器 + cog.yaml；同时 serve 模型 + agent 时合并部署最简单。Kubernetes（走 Agent Sandbox 模式）适合真需要多租户、gVisor 隔离、或者已经超出托管平台能力。
LangGraph vs 手写状态机 — 单轮 agent（一次 LLM 调 + 工具）别拉 LangGraph 进来，纯负担。多轮图 + 分支 + 重试 + 人工介入，LangGraph 的 checkpointer 让崩溃可恢复，值这个体积。
Upstash Redis vs 自托管 Redis — Upstash 是 serverless、按请求计费；超过 ~1000 万 commands/月之后 $20 的 Redis VM 反而更便宜。迁移就是改个 URL。别提前优化。

常见踩坑

session state 写本地磁盘或进程内存。下次 pod 重启全没了，用户骂你失忆。第一天就把 state 写进 Redis（或你的 DB），不是出事之后再改。
工具调用没沙箱。agent 第一次幻觉出 subprocess.run(['rm', '-rf', '/']) 而你的服务真跑了，生产集群就完了。只要工具包含 shell 或代码执行，E2B/Daytona/Modal Sandbox 不是可选项。
Serverless 跑长 agent 轮次。大多数 serverless 有最大执行时间（Lambda 15min、Vercel 5min、Modal 最长 24h）。如果单轮可能 30+ 分钟，要么选 Modal（长超时），要么把活推进队列让 HTTP 请求立刻返个 job ID。
FastAPI 骨架里没设请求级超时。没超时一次卡死的 LLM 调用就能把 worker 池耗干。HTTP 边界、LLM 客户端、工具调用三层都要显式设超时。
把完整 prompt + response 全打日志。开发期感觉很爽，生产环境 PII 漏进不合规的日志聚合器。截断、脱敏、采样后再打，完整 trace 留给 LLM observability（Langfuse、Phoenix）走访问控制。

安装 · 一行命令

$ tokrepo install pack/agent-deployment-templates

丢给 agent，或粘到终端

包内含什么

10 个资产打包就绪

Skill#01

Agno — Production AI Agent Runtime

Agno is a runtime for building and managing agentic software at scale. 39.1K+ GitHub stars. Stateful agents, FastAPI serving, 100+ integrations, tracing. Apache 2.0.

by Agno·309 views

$ tokrepo install agno-production-ai-agent-runtime-f73bc89d

Skill#02

PydanticAI — Type-Safe AI Agent Framework

Build production-grade AI agents with type safety, structured outputs, and multi-model support. By the creators of Pydantic and FastAPI.

by Pydantic·236 views

$ tokrepo install pydanticai-type-safe-ai-agent-framework-0313bf39

Agent#03

Modal Sandboxes — Secure Cloud Code Execution for AI Agents

Modal Sandboxes spin up secure Linux environments for agent-generated code in seconds. Custom images, GPUs, persistent volumes from any Modal Function.

by Modal·227 views

$ tokrepo install modal-sandboxes-secure-cloud-code-execution-for-ai-agents

Skill#04

modal-examples — Serverless LLM Jobs on Modal

Learn production patterns for serverless jobs (LLM inference, data pipelines) using Modal’s official examples. Run one and adapt it to your workload.

by Script Depot·146 views

$ tokrepo install modal-examples-serverless-llm-jobs-on-modal

Skill#05

Replicate Cog — Containerize ML Models with One YAML File

Cog is Replicate's open-source tool to wrap an ML model in a Docker container. One cog.yaml + predict.py gives you a portable, GPU-aware HTTP model.

by Replicate·181 views

$ tokrepo install replicate-cog-containerize-ml-models-with-one-yaml-file

Skill#06

E2B — Secure Sandboxes for AI Code

E2B runs AI-generated code in isolated cloud sandboxes. Install the Python/JS SDK, set `E2B_API_KEY`, then execute commands safely inside a sandbox.

by Agent Toolkit·246 views

$ tokrepo install e2b-secure-sandboxes-for-ai-code

Skill#07

Daytona SDK — Programmable Dev Sandboxes for AI Agents

Daytona SDK spawns Linux dev environments in 90 ms. Run agent-generated code, browser automation, ML jobs. Snapshot + fork to branch execution.

by Daytona·244 views

$ tokrepo install daytona-sdk-programmable-dev-sandboxes-for-ai-agents

MCP#08

Upstash MCP — Serverless Redis & Kafka for AI Agents

MCP server for Upstash serverless Redis and Kafka. Give AI agents access to caching, rate limiting, pub/sub, and message queues with zero infrastructure. Pay-per-request pricing. 2,000+ stars.

by MCP Hub·244 views

$ tokrepo install upstash-mcp-serverless-redis-kafka-ai-agents-e0ed3953

Skill#09

LangGraph — Build Stateful AI Agents as Graphs

LangChain framework for building resilient, stateful AI agents as graphs. Supports cycles, branching, persistence, human-in-the-loop, and streaming. 28K+ stars.

by LangChain·643 views

$ tokrepo install langgraph-build-stateful-ai-agents-graphs-cc1a6ed2

Skill#10

Agent Sandbox — Run Agents Safely on Kubernetes

Agent Sandbox provides Kubernetes-first guardrails for agent workloads: resource limits, isolation, and repeatable environments so failures stay contained.

by AI Open Source·164 views

$ tokrepo install agent-sandbox-run-agents-safely-on-kubernetes

常见问题

10 个工具真的都需要吗？看着好多。

你需要每层选一个，不是 10 个全装。pack 在同层列了备选（2 个骨架、3 个沙箱、3 条部署路径）— 按你的规模挑。1 人独立开发者最小可行生产 agent：Agno（骨架）+ Upstash Redis（状态）+ E2B（沙箱）+ Modal（部署）— 4 件套，一下午就上线。agent 长成多步图再加 LangGraph。撑不下托管平台再上 Agent Sandbox on Kubernetes。

这套月成本大概多少？

小 agent 每天处理几千请求场景：Modal ~$5-50/月（按秒计费、缩到零），Upstash Redis 免费层或 ~$10/月，E2B 免费层（100h/月）或稳定用 ~$30/月，开源骨架和 LangGraph 不要钱。合计 $15-100/月端到端。真正的成本是 LLM 调用，通常远超基础设施；这套挑法是让基础设施在 model 账单面前是个零头。

这个跟 LLM Observability pack 重叠吗？

不同层。这个 pack 是部署层 — agent 进程怎么活、怎么持久化、怎么 serve 流量。LLM Observability（Langfuse / Phoenix / AgentOps）是应用语义层 — prompt / trace / eval。两个都要。骨架第一天就发 OpenTelemetry；observability 那套接住。大多数团队先上这个 pack（agent 还没部署观测什么），同周再上 observability。

如果我已经在 Modal 上跑了，为啥还推 E2B？

如果你的计算已经在 Modal 上，Modal Sandboxes 就是答案 — 同 auth、同账单、模型调用低延迟、不引入第二朵云。E2B 的赢面是你部署在别的目标上（Fly / Replicate / k8s）但需要一个不拖第二个账号进来的沙箱。Daytona 的赢面是沙箱要活几小时甚至几天（coding agent 的持久化工作区），而不是几秒。

这套能跑长任务、多步的研究型 agent 吗（不是聊天 agent）？

能 — 这套套件本来就是奔着这种场景设计的。用 LangGraph 写图 + checkpoint（单轮崩了能恢复），checkpointer state 放 Upstash Redis，每个长步骤推进 Upstash Kafka 跑在 worker pod 里，任何执行代码的工具用 E2B 或 Daytona 沙箱，部署在 Modal（长超时）或走 Agent Sandbox 模式上 Kubernetes（需要真多租户）。HTTP /run 立刻返 job ID，客户端 poll 或订阅拿结果。

更多主题包

12 个主题包 · 80+ 精选资产

回首页浏览全部精选合集

返回主题包总览