AI 视频生产线
Remotion / OpenMontage / MoviePy + agent 每天出片用的 headless 流水线。
这个 pack 装了什么
这个 pack 收齐了七个视频生产资产,是每个每天出 AI 短视频(TikTok / YouTube Shorts / Reels)的团队都会出现的组合。三个是头部框架;四个是把它们接成流水线的 headless 模板。
| # | 资产 | 类型 | 干什么 |
|---|---|---|---|
| 1 | Remotion | TypeScript 框架 | 用 React 写视频、服务端渲染 |
| 2 | OpenMontage | 流水线 | LLM 驱动选 b-roll + 拼接 |
| 3 | MoviePy | Python 库 | 程序化剪辑、ffmpeg 封装、字幕 |
| 4 | 日更内容流水线 | 模板 | 主题 → 脚本 → TTS → 渲染 → 上传 |
| 5 | 字幕自动生成 | 模板 | Whisper STT → SRT → 烧入样式 |
| 6 | B-roll 预取 | 模板 | 搜索 → 下载 → 渲染前缓存 |
| 7 | 多平台发布 | 模板 | 一次渲染 → TikTok + Shorts + Reels |
为什么要装
Twitter 上看到的「AI 视频」工具都是 UI 壳子 —— 一次性内容能用,每天出 10 条没用。真正的生产流水线是 headless 的:写代码、CI 渲染、API 上传、重复。这个 pack 收齐了这七块拼成流水线的零件,没有一个需要设计师在线。
三个头部框架各自下不同的赌注:
- Remotion 下「视频是代码」的赌注。你写 React 组件,被 headless Chromium 渲成 MP4 帧。你拿到版本控制、热重载、程序化数据绑定,以及任何前端 dev 都熟悉的模板语言。同壳不同数据的品牌系列最适合。
- OpenMontage 下「LLM 当剪辑」的赌注。给它脚本,它从素材库挑 b-roll、排顺序、渲染。要零干预自动化、不在意每个剪辑都完美,就用它。
- MoviePy 下「全 Python」的赌注。直接的 ffmpeg 封装,剪 / 拼 / 叠 / 加效果都有干净 API。要全控制又不需要 React 时最适合。
四个流水线模板是「我能渲一条视频」和「我每天 cron 跑 50 条」之间的差距。它们覆盖真实的运营步骤:写脚本、字幕、b-roll、多平台发布。
一条命令装齐
# 装整个 pack
tokrepo install pack/video-production-ai
# 或挑你真要的框架
tokrepo install remotion
tokrepo install openmontage
tokrepo install moviepy
TokRepo CLI 把框架适配器装进你的 AI 工具 —— Claude Code subagent 进 .claude/agents/,Cursor 规则进 .cursor/rules/,Codex CLI 进 AGENTS.md。Node / Python 自己 npm install / pip install。TokRepo 接好 prompt 让 Claude Code 之类的 agent 知道什么时候调 Remotion vs MoviePy。
常见坑
- 渲染前预取所有素材。流水线中途拉素材会卡 30+ 秒、频繁超时。B-roll 预取模板(资产 6)先把所有东西下到本地缓存;生产跑别跳过。
- 别 1080p 渲再发 9:16。TikTok / Shorts / Reels 都要 1080×1920 竖屏。1920×1080 渲了再裁浪费 50% 渲染时间。Remotion 的
<Composition>和 MoviePy 的resize()显式设画布尺寸。 - 长镜头字幕会偏 0.3 秒。Whisper 的词时间戳在连续音频上漂。用 WhisperX 强对齐,或给 SRT 条目加 100ms 缓冲;字幕错位是观众第一个发现的质量问题。
- 不带侧链音乐会盖过解说。音乐轨上挂个键于 VO 的 ducking 压缩器,感知质量提升的 90% 就在这。MoviePy 和 ffmpeg 都能做 —— 看流水线模板里的音频后处理 recipe。
- YouTube Shorts 有隐藏长度限制。截至 2026 是 180 秒,但算法仍偏爱 <60 秒。多平台发布模板默认 Shorts 封 58 秒、TikTok / Reels 封 60 秒。
这个 pack 不够用的时候
这个 pack 管生产流水线,不管创意方向。视频不好看通常是:
- 没真实源内容。AI 生成 b-roll + AI 配音 + AI 字幕加起来等于垃圾。这个 pack 配浏览器自动化 pack 爬真源数据、配语音 AI 栈 pack 做生产级 TTS(ElevenLabs / Cartesia)、配真实编辑视角。
- 一个模板用到死。每天出 10 条同壳视频两周内必降权。至少做 3-4 个视觉模板轮换。
- 没人 QC。再好的流水线,约 5% 生成视频会有刺眼错(logo 错、字幕错位、空帧)。发布前过一遍人眼能保住你的频道。
Pack 本身是装配线。脚本、数据、编辑品味还是要你自己带。
7 个资产打包就绪
常见问题
Remotion 免费吗?
Remotion 对个人和营收阈值以下公司免费(截至 2026 年是 ARR $10M 以下)。超过要商业许可。MoviePy 完全 MIT 无限制。OpenMontage 是 OSS。多数日更团队在 Remotion 免费层里舒服得很;大组织查他们许可页确认。
Codex CLI 或 Cursor 能用吗?
框架工具无关 —— 是 Node / Python 库。任何能跑 shell 命令、编辑文件的 AI 工具都能驱动。TokRepo CLI 给每个 AI 工具装对应配置:Claude Code 用 subagent、Codex CLI 用 AGENTS.md、Cursor 用规则。实际渲染还是在终端 npm / pip 跑。
Remotion 跟 MoviePy 怎么选?
Remotion 用 React + headless Chromium 渲 —— 团队已经写前端、想要热重载预览就最棒。MoviePy 是薄的 Python ffmpeg 封装 —— 流水线已经 Python 或要细粒度 ffmpeg 控制最棒。经验法则:品牌模板内容用 Remotion、拼接 / 重特效定制剪辑用 MoviePy、要 LLM 驱动剪辑决策用 OpenMontage。
跟语音 AI 栈 pack 有啥区别?
语音 AI 栈管 TTS 生成(ElevenLabs / Cartesia / Zonos)和 STT(Whisper)。视频生产 AI 消费这些输出但不生产它们。完整日更视频流水线两个 pack 都需要:语音 AI 做配音、视频生产 AI 拼视觉 + 字幕 + 最终渲染。多数团队第一天就两个都装。
什么时候*不*该上程序化视频流水线?
目标是单条精修品牌片、不是吞吐时。人剪 DaVinci Resolve 单条质量超任何流水线。流水线赢在每天 10+ 条且一致性比艺术性重要时。没明确编辑格式也跳过 —— 自动化放大你的模板,模板得先足够好。