一个人写并出版一本书 — 自出版作者全链路
十件套,给一个人写并出版一本书的独立作者:从大纲、AI 共写、长文 Markdown 编辑、AI 封面图、Pandoc + Calibre 排版 EPUB/MOBI、AI 朗读音频书、到 Ghost / Substack 风格的长文连载首发地。编辑型推荐 — 不吹版税神话。
这个 pack 包含什么
你是一个人在写一本书。没有经纪人,没有出版社,没有责编。你同时还是封面设计师、EPUB 技术员、有声书播音员、上市营销官、以及半夜读 KDP 服务条款的那个人。市面上每篇"AI 给作家用"的清单要么是 (a) 联盟营销页,要么是 (b) 一堵 50 个工具的墙没有装机顺序。
这个 pack 是一套精心挑选的十件套,对应一个自出版作者真正会跨过的六层:
- 大纲(outline) — 全书结构、章节节拍、场景卡
- 草稿(draft) — AI 共写 + 长文编辑器,撑住每日字数
- 编辑(edit) — 二审工具做句子级修订
- 封面(cover) — 专给书封调过的 AI 出图(不是 Instagram 风)
- 排版(format) — Markdown → EPUB / MOBI / 印刷级 PDF(Pandoc + Calibre)
- 出版(publish) — Amazon KDP 上架(电子 + 平装)+ Ghost / Substack 风格的连载首发地
这里全部开源或可自托管。市面上常被提到的两个付费替代品 — Scrivener 和 Sudowrite — 是好产品;本 pack 走 OSS 优先路线,免得你为了一本月入 40 美金的书订了 5 个 SaaS。
推荐安装顺序(outline → draft → edit → cover → format → publish)
- Novel — Notion 风 AI 编辑器组件 (大纲 + 草稿起步) — 从这里开始。WYSIWYG 块编辑器 + 斜杠命令 + Notion 手感,自带 AI 续写,足够把章节之间那些过渡性句子代笔写完。先在 Novel 里把每章大纲 + 每节前 500 字铺出来,再换重的编辑器。
- Claude Code Agent: Technical Writer (AI 共写) — 原本调给 API 文档的 agent,但它做的散文压缩是 AI 对长篇手稿能做的最有用的事:砍废话、统一声音、发现第 2 章和第 11 章互相矛盾。丢进
.claude/agents/,每章人审前跑一遍。 - Zettlr — 学术写作开源 Markdown 编辑器 (每日写作面) — 无干扰的长文 Markdown 编辑器,内置 Pandoc、引用管理器、手稿感知侧边栏(章节、单文件字数、项目总字数)。这里是你每天 1500 字硬磕的地方。
- MarkText — 简洁优雅的开源 Markdown 编辑器 (二审编辑) — 轻量的 WYSIWYG-Markdown 混合编辑器,用于二审。每次只开一章,没有手稿应用那种文件树噪音。和 Zettlr 配对用(Zettlr 写、MarkText 改),而不是二选一。
- Stable Diffusion Web UI(AUTOMATIC1111) (封面初稿) — 本地 Stable Diffusion,封面概念设计用。一小时能出 50 张,每张零成本。用 SDXL 或 Flux 模型,别用 1.5 默认 — 书封需要照片级细节。
- InvokeAI — Stable Diffusion 专业创作引擎 (封面收尾) — 专业画布 + 图层级 inpainting + ControlNet。在 #5 里找到概念后,如果标题文字需要落在图像的某块特定留白上,就在这里收尾。把 #5 当 ideation,#6 当 composition。
- Pandoc — 通用文档格式转换器 (排版) — Markdown 到一切的转换器。一条命令把章节
.md转成合规 EPUB、印刷级 PDF(走 LaTeX)、给可能仍要请的编辑用的 Word.docx。早点学--reference-doc和--epub-cover-image。 - Calibre-Web-Automated — 自托管电子书库 + 自动导入与转换 (排版 + EPUB 质检) — 自托管的 Calibre 套壳。最杀手的用法是 EPUB 质检:导入 Pandoc 输出,在三个阅读引擎里看一遍,把目录和 CSS bug 都修掉再上传 KDP。顺便 EPUB → MOBI 自动转换给老 Kindle 用。
- F5-TTS — Flow Matching 文本转语音 (有声书朗读) — 开源零成本 TTS,朗读非虚构章节够用,但对话密集的小说仍能听出 AI 味。法律重点:Audible / ACX 从 2025 起允许 AI 朗读的有声书但要求显式声明,别漏掉。
- Ghost — 现代新闻业的专业发布平台 (出版 + 长文连载) — 自托管 Ghost 是 Substack 的开源替代,可以在手稿还在写的时候把章节做成 newsletter 连载。免费读者的渗透打不过订阅墙首发。Substack 也行;想要拥有邮箱列表和域名就选 Ghost。
它们怎么协同
大纲(Novel #1)
│
├── 章节结构 + 每节前 500 字
│
草稿循环:
Zettlr (#3) ⟵──── 每日写作
│
└── Technical Writer agent (#2) ── 每章一次散文压缩
│
└── MarkText (#4) ── 人审编辑
│
▼
最终 Markdown 手稿
│
├── Pandoc (#7) ───► EPUB / PDF / DOCX
│ │
│ └── Calibre-Web-Automated (#8) ─ EPUB 质检、MOBI 转换
│
├── SD WebUI (#5) ─► 概念 ─► InvokeAI (#6) ─► 最终封面 PNG
│
└── F5-TTS (#9) ──► 各章 WAV/MP3 有声书
│
出版:
├── Amazon KDP 上传(EPUB + 封面 + 平装 PDF)
├── Audible / ACX 上传(有声书 + AI 朗读声明)
└── Ghost (#10) ── 章节做成 newsletter 给 ARC 读者连载
撑起整套的核心三件套是 Zettlr + Pandoc + Calibre-Web-Automated:写作面、格式转换、质检阅读器。少一件,上线那周你就在跟 EPUB 校验器报错搏斗,没空做营销。
你会遇到的取舍
- AI 写作 vs 纯人类作者 — 让 AI 起一段话省时间。让 AI 写整章会出现"第二章质量 dropoff":模型在 4000 字后丢失声音一致性。最佳实践:AI 写连接性内容和大纲,凡是带情绪或论证的场景一定人写。
- KDP vs 传统出版 — KDP 72 小时上线,版权全留。传统出版给你书店上架和不用你付的印量,但要 12-18 个月周期 + 独家。非虚构 + 明确受众基本都是 KDP 赢。文学小说想冲文学奖那一类,账要重算。
- 平装 vs 纯电子 — KDP 按需印刷让平装几乎免费加,亚马逊上有实体书会显著提高电子书的可信度。除非话题极冷门没人会浏览实体,否则默认两个都上。
- Substack vs 自托管 Ghost — Substack:零运维 + 站内互推 + 抽 10% 收入。Ghost (#10):列表是你的,没有平台抽成,服务器自己运维。先上 Substack 起步,列表过 1000 付费再迁 Ghost。
- AI 封面(#5/#6)vs Fiverr 设计师 — 35 美金 Fiverr 封面合格但容易忘。6 小时 AI 调图可能惊艳也可能业余。判断标准:能用三个具体视觉参照描述这本书的调性 = AI 赢。说不出来 = 雇人。
常见踩坑
- AI 第二章质量 dropoff — 模型写的第一章新鲜在调,第二章开始飘。修法:每章开始前给 agent 重塞一段一句话风格表(
声音:怀疑式 / 第二人称 / 不用分号),全稿写完最后再用 #2 全量跑一遍抓漂移。 - EPUB 排版混乱 — Pandoc 出的 EPUB 合规但默认很丑。
--css自定义样式 +--reference-doc模板是必选不是可选。上传 KDP 前一定要在 Calibre-Web-Automated 和真正的 Kindle 上各预览一次 — 网页预览会骗人。 - 封面违反 KDP 规 — KDP 会拒带裁切文字、漏了 AI 水印、出血线不对的封面。读一次 KDP 封面规范,存成 checklist,每次导出都过一遍。被拒就是 48 小时。
- 没做 ARC(advance reader copy)推广 — 零评论上市是自出版最大的错。用 Ghost (#10) 上市前 30 天把最后三章发给一个封闭 list 连载,上市当天求他们老老实实给 Amazon 评论。20 条真评胜过任何广告投放。
- 有声书版税算错 — Audible / ACX 独家合约 40% 版税、非独家 25%。AI 朗读从 2025 起允许但必须声明,有作者反馈声明后曝光会降。别假设有声书一定赚 — 拿自己实际定价 × 时长真算一遍。
10 个资产打包就绪
常见问题
Sudowrite 写小说够好吗?
对路数固定的类型小说(言情、惊悚、温馨悬疑),Sudowrite 是真有用 — 它懂套路、生成可用场景草稿比多数人打字还快。但对文学小说或有强烈个人声音的作品,它会把你往"类型平均线"上推,你省下的时间反过来都在跟它斗回自己的风格。本 pack 用开源的 Novel (#1) + Technical Writer agent (#2) 覆盖 Sudowrite 月费 19-59 刀干的大部分活,代价是你自己写更多 prompt。两个都试,看哪个让你需要重写的句子更少。
Amazon KDP 上传一本书到底要哪些资料?
一个 KDP 账号(免费,10 分钟)、税务问卷(美国 W-9 / 国际 W-8BEN,20 分钟)、收版税的银行账号、加上三个文件:EPUB 或 DOC 手稿(本 pack:Pandoc #7 从 Markdown 出)、目标 trim 尺寸的封面图(Stable Diffusion WebUI #5 → InvokeAI #6 出)、想上平装的话还需要平装内文 PDF(仍然 Pandoc,配 --pdf-engine=lualatex)。再加 metadata:标题、副标题、7 个分类、7 个关键词、4000 字内描述。文件齐备后纯设置时间 90 分钟。审核一般 72 小时内通过。
AI 朗读的有声书能挂 Audible 吗?
2025 起可以 — ACX(Audible 上传后台)接受 AI 朗读的有声书,但必须显式声明:标题里要标 AI 朗读,有作者反馈声明后曝光会降。F5-TTS (#9) 出的质量对非虚构和教育类书够听;对话多的小说仍听得出 AI 味,评论容易差。经济账:AI 让你 0 元做有声书 vs 人工 200-400 美金/成品小时,但单本版税预计低于人工朗读版。按自己题材重算。
Stable Diffusion / InvokeAI 出的封面能商用吗?
通常可以 — Stable Diffusion 1.5、SDXL、大部分社区 Flux 变体的权重协议都允许输出商用。KDP 当前不禁 AI 封面但要求上传时声明 AI 参与。剩下的风险点:商标(别复刻有版权的角色形象)、风格模仿(别给商用封面写 "in the style of [在世艺术家]")、内嵌水印(某些模型留淡水印,提交前 100% 放大检查)。每个 checkpoint 的具体 model card 都要看一眼,社区 Flux 模型偶尔有非商用限制。
自出版真能赚钱吗?
实话:多数自出版的书一辈子收入低于 1000 美金。一个活跃 KDP 作者的月版税中位数是几百美金。月入五位数的作者基本都满足以下之一:(a) 热门类型里有持续月更的系列、(b) 有现成的受众在卖、(c) 非虚构 + 配套付费课/咨询。这个 pack 不会魔法改变这一点。但它能做到:把单本生产成本从 2000-5000 美金(封面 + 编辑 + 排版 + ISBN + 播音)压到 200 美金内,这样销量一般的书仍能盈亏平衡。把第一本当学习项目,第三、第四本再有收入预期。