TOKREPO · 主题包
本周新建

独立游戏开发 AI 工具组合

给 Unity / Godot / Unreal 上独立开发的十件套:Aseprite + Blender MCP 出美术,AudioCraft 做音乐,Chatterbox + Cartesia 配 NPC 语音,Unity / Unreal / Godot 接引擎,Game Designer agent 调机制,LibreTranslate 做本地化 — 美术 / 音效 / NPC / 关卡 / 本地化全流程覆盖。

10 个资产

这个 pack 包含什么

五层。每层两个选择,除非某个工具已经把那一层独占了:

  • 美术(概念 → 2D 精灵 → 3D 模型) — Aseprite 做像素图和帧动画;Blender MCP 让 Claude / Cursor agent 通过自然语言驱动 Blender 建模、贴图、绑骨。
  • 音频(音乐 + 音效 + NPC 配音) — AudioCraft(Meta)做音乐循环和环境音效;Chatterbox 做过场旁白的开源 TTS;Cartesia Sonic TTS 做游戏内实时 NPC 配音,~75ms 首音时延才扛得住实时触发。
  • 引擎桥接(Unity / Unreal / Godot) — Unity MCP 和 Unreal MCP 让 agent 直接驱动编辑器(拖场景、导资产、改脚本);Godot 是给不想踩商用授权悬崖的独立开发者的开源引擎。
  • 关卡 + 机制设计 — Game Designer Claude Code agent:内置一套系统提示,能围绕玩家循环、平衡性、难度曲线、经济系统真做推理,而不是生成废话。
  • 本地化 — LibreTranslate 自托管做首过机器翻译,30+ 语言一把过,再人工润色;和你引擎的 i18n CSV 配套。

如果你只是做一个 10 分钟的 jam game,本 pack 你用不上 — itch.io 和你现成的工具链就够。本 pack 针对的是真要在一年内做完并发布一款商业独立游戏的场景:下面每一层都是某条「独立开发者怎么自己搞 X」的 Reddit 长帖。

推荐安装顺序

  1. Aseprite — 像素图 + 帧动画。便宜,2D 独立的工作流核心。从这里开始,哪怕你的最终游戏是 3D — 图标、UI、概念板你都会用它。
  2. Blender MCP — 给 agent 的 3D 建模桥。让 Claude Code / Cursor 用自然语言驱动 Blender。不是 3D 美术出身的单人开发者拿到能用的低多边形资产、不用先背 Blender 快捷键的最快路径。
  3. AudioCraft — 音乐 + 环境音效生成。Meta 的开源模型族(MusicGen + AudioGen)。12GB+ 显卡本地跑;音乐能做成循环,可以拿自己的参考曲微调出风格一致的素材。
  4. Chatterbox — 过场旁白用的开源 TTS。一次性预渲染的过场配音、开篇 / 收尾旁白、图鉴条目 — 任何在打包时就能烤进音频文件的地方。
  5. Cartesia Sonic TTS — 游戏内低时延 NPC 配音。~75ms 首音时延,才扛得住玩家行为实时触发的动态 NPC 对白。不是最便宜,但快得过的只有它。
  6. Unity MCPUnreal MCP — 按你的引擎二选一。让 AI agent 开场景、导网格、挂脚本、跑构建,不用你点编辑器。重复的场景搭建一下午一下午地省。
  7. Godot — 引擎本体,如果你还没绑死 Unity / Unreal。开源、零分成、轻量级,2026 年新项目无历史包袱的独立默认选择。
  8. Game Designer agent — Claude Code agent,专攻机制、平衡、玩家成长。在设计文档阶段用,每个里程碑「这玩意儿到底好不好玩,还是只是忙」时也用。
  9. LibreTranslate — 自托管机器翻译,过你的 UI / 对话字符串。笔记本本地跑,无 API 账单、无隐私泄露。首过 MT 而已;上线时每种语言再花几百美元做人工润色。

它们怎么协同

概念文档 + Game Designer agent
         │
         ├──> 美术管线
         │      Aseprite (2D / UI) ──┐
         │      Blender MCP (3D)  ──┼──> 引擎资产
         │                          │
         ├──> 音频管线
         │      AudioCraft (音乐/音效) ──┐
         │      Chatterbox (过场旁白)    │
         │      Cartesia (实时 NPC)      ├──> 引擎资产
         │                               │
         └──> 引擎 (Unity / Unreal / Godot 通过 MCP)
                  │
                  ├──> 构建 & 测试循环
                  └──> i18n CSV ──> LibreTranslate ──> 上线语言

关键洞察:音频改起来便宜,美术不便宜。先锁死美术风格(Aseprite 色板、Blender 材质库),再让音频按这个美术去生成。别在你还不知道游戏长什么样之前就生成 200 段音乐循环。

你会遇到的取舍

  • 商用授权检查没得商量 — AudioCraft(Meta)某些地方写的是研究授权;Cartesia 是商业付费;Chatterbox 较宽松(发版前再查一遍 LICENSE)。第一天就在 repo 里放一个 LICENSES.md,每加一个工具更新一次。
  • 生成资产之间的风格一致性 — 一个 prompt 生的精灵图和另一个 prompt 生的 3D 模型对不上,两者又都对不上生成的音乐。生成之前就锁死参考色板 + mood board,并在工具支持的地方作为 conditioning 传进去。
  • 引擎集成才是真正的成本 — 把 AI 生成的 3D 模型导进 Unity / Unreal 并保持正确的缩放、轴心、材质槽 — 这就占了一半工作量。按资产类型写导入脚本,不是按单个资产。
  • GPU 需求叠加上去很恐怖 — AudioCraft(12GB+)、Cartesia(云)、Aseprite(无)、Blender(什么都能跑)、Chatterbox(8GB+)。一张 4090 本地全包;12GB 以下建议把音频生成推到 Replicate。
  • 「全 AI 独立游戏」还是个 meme — 至今所有上线规模化的「纯 AI」独立游戏,背后都有人在编辑每一个资产。AI 现实上是有审美的单人开发者的 5-10 倍放大器 — 不是替代品

常见踩坑

  • 资产风格漂移 — 不同 prompt → 不同美术方向 → 游戏感觉违和。修法:写一页纸的风格指南(色板 hex、线条粗细、光照氛围、音乐调式 / BPM),每次生成 prompt 都拼上去。
  • 没看 LICENSE 就发版 — 「开源」模型往往禁止商用或要求署名。看模型 GitHub repo 里的 LICENSE 文件,不要看 README。Steam 一旦发现你授权不干净会给你打 refund flag。
  • NPC 对话一眼 LLM — 「我感受到你的存在,旅人」这种话就是露馅。修法:每个 NPC 写 5-10 条人格锚(专用词汇 / 绝对不说的话 / 口头禅),每次对话 prompt 都注入。离线烤好,除非必要别在游戏运行时跑大模型。
  • 本地化字符串撑爆 UI 框 — 德语比英语长约 30%,俄语类似;日语 / 中文短约 30% 但断行规则不同。UI 从第一天就要做成文本容器自适应,不是上线前一周再修 bug
  • 音乐循环接不上 — AudioCraft 输出的是裸音频,loop point 你得在 Audacity 里手动剪。按「30 秒前奏 + 循环主体 + 4 小节尾」的结构规划每首;想让一段 30 秒的整 blob 直接循环 — jam game 里 80% 的音频难听都是这么来的。
安装 · 一行命令
$ tokrepo install pack/indie-game-dev-ai
丢给 agent,或粘到终端
包内含什么

10 个资产打包就绪

Skill#01
Aseprite — Animated Sprite Editor & Pixel Art Tool

Aseprite is an animated sprite editor and pixel art tool for Windows, macOS, and Linux. It provides specialized tools for creating 2D animations, tilemaps, and sprite sheets used in game development and digital art.

by AI Open Source·53 views
$ tokrepo install aseprite-animated-sprite-editor-pixel-art-tool-eeae1e55
Skill#02
Blender MCP — AI Integration Server for 3D Creation

A Model Context Protocol server that connects AI assistants to Blender, enabling natural language control over 3D modeling, scene creation, and rendering workflows.

by Script Depot·55 views
$ tokrepo install blender-mcp-ai-integration-server-3d-creation-cef5f831
Skill#03
AudioCraft — AI Audio Generation by Meta

AudioCraft is a PyTorch library from Meta Research providing code and pre-trained models for audio generation including music, sound effects, and audio compression.

by Script Depot·21 views
$ tokrepo install audiocraft-ai-audio-generation-meta-8a0d7a57
Skill#04
Chatterbox — State-of-the-Art Open Source Text-to-Speech

A high-quality open-source TTS model by Resemble AI that delivers natural-sounding speech with fine-grained control over prosody, emotion, and expressiveness.

by Script Depot·81 views
$ tokrepo install chatterbox-state-art-open-source-text-speech-a6af5d44
Skill#05
Cartesia Sonic TTS — 75ms Time-to-First-Audio

Cartesia Sonic is a state-space-model TTS with 75ms time-to-first-audio. 100+ voices, 5s cloning, streaming WebSocket. Lowest-latency TTS.

by Cartesia·93 views
$ tokrepo install cartesia-sonic-tts-75ms-time-to-first-audio
MCP#06
Unity MCP — Control Unity Editor from Agents

Unity MCP bridges MCP clients to your Unity Editor so assistants can manage scenes, assets, scripts, and builds via tools instead of manual clicking.

by MCP Hub·46 views
$ tokrepo install unity-mcp-control-unity-editor-from-agents
MCP#07
Unreal MCP — Control Unreal Engine via MCP

Unreal_mcp provides an MCP server + C++ Automation Bridge for Unreal Engine; verified 617★ and supports direct HTTP MCP at :3000.

by MCP Hub·69 views
$ tokrepo install unreal-mcp-control-unreal-engine-via-mcp
Skill#08
Godot Engine — Multi-Platform 2D and 3D Game Engine

Godot is a free and open-source 2D and 3D game engine with a fully integrated editor, GDScript scripting language, C# support, visual scripting, and export to all major platforms. The community-driven alternative to Unity and Unreal.

by Script Depot·112 views
$ tokrepo install godot-engine-multi-platform-2d-3d-game-engine-65c0cac6
Skill#09
Claude Code Agent: Game Designer

Game design specialist focusing on mechanics, balancing, player psychology, and system design. Use PROACTIVELY for gameplay mechanics, progression systems, difficulty curves, and u

by TokRepo精选·25 views
$ tokrepo install claude-code-agent-game-designer-da39c607
Skill#10
LibreTranslate — Self-Hosted Translation API with No Rate Limits

LibreTranslate is a self-hostable translation API powered by open-source Argos Translate models. No API keys, no rate limits, no data sent to third parties — a drop-in replacement for Google Translate when privacy matters.

by AI Open Source·212 views
$ tokrepo install libretranslate-self-hosted-translation-api-no-rate-limits-3109a712
常见问题

常见问题

2026 年 Midjourney 商用授权问题解决了吗?

Midjourney Pro / Mega 套餐是给生成图像授予了商用权,但发版前你还是得自己看一遍当前 ToS。AudioCraft(Meta)和 Stable Diffusion 衍生模型都有自己每个模型一份的 LICENSE 文件,会覆盖平台条款 — 看那个。安全规则:在你读过源码仓库里的 LICENSE 之前(不是营销页),假设所有东西都不能商用。

Unity vs Godot — 2026 年哪个 AI 工具更多?

Unity 总工具量更多,靠的是 asset store 的惯性(Unity MCP、ML-Agents、几十个 asset-store 集成)。Godot 的 AI 集成更少但更干净,因为引擎本身就开源,脚本化集成简单。单人独立全新开始、又担心分成悬崖 — 选 Godot 更稳;已经有 Unity 肌肉记忆的团队 — Unity + Unity MCP 出活更快。

NPC 对话怎么不让它 OOC(出戏 / 不像角色)?

三件事:(1) 每个 NPC 写 5-10 条人格锚(具体专用词汇 / 绝对不说的话 / 口头禅),每次对话 prompt 都注入;(2) 离线烤好对话,别在游戏运行时跑生成 — 离线你能筛输出;(3) 情绪高潮(死亡 / 胜利 / 背叛)保留一小批人写的台词,让 AI 只负责中间填充。三个组合远强于任何单一的 prompt 工程小技巧。

独立开发者本地化最便宜的路径是什么?

笔记本本地跑 LibreTranslate,把你的 i18n CSV 过一遍机器翻译,覆盖 5-10 个目标语言。然后在 Fiverr / Upwork 找母语者按 ~$0.05-0.10/单词为你最在乎的 Top 3 语言做 QA。一个 5000 词的独立游戏总成本:3 种语言人工润色 ~$250-500,其他语言 MT 一过 $0。中文 / 日文 / 阿拉伯文不要不过人审就发 — 文字方向和语法 MT-only 一眼破绽。

能完全用 AI 出一个独立游戏吗?

机械上能,商业上存疑。每一个上线的「纯 AI」独立游戏背后都有人在编辑每一个资产、写设计文档、调经济系统、修 LLM 的胡话对白。AI 现实上是一个有审美的单人开发者的 5-10 倍放大器 — 不是替代。Steam 2026 年的政策要求你披露 AI 生成内容,玩家对纯 AI 项目也越来越警惕。规划成用了大量 AI 的人工主导独立游戏,而不是有人看着的 AI 主导项目。

更多主题包

12 个主题包 · 80+ 精选资产

回首页浏览全部精选合集

返回主题包总览