AI 小白零基础入门 — 第一周用 AI 的 8 个起步工具
8 个低门槛工具,给第一次接触 AI 的非技术小白。Open WebUI 聊天、Morphic 搜索、Khoj 当第二大脑、Fooocus 出图、VideoCaptioner 做视频、PPTX skill 出 PPT、Meetily 录音整理、Novel 当 AI 写作板。按推荐顺序装,一周下来就能用 AI 干活 — 不讲黑话,不写代码。
这个 pack 包含什么
如果你从来没用过 AI,看教程发现每篇都默认你已经知道什么叫「API key」 — 这个 pack 就是给你的。我们按一个普通人第一周真正会用到的 八件事,每件事挑了一个最低门槛的工具。这里所有工具都不需要你写代码,也不需要先掏信用卡。
目标不是「装一个 ChatGPT 然后撒手」。目标是周日晚上你能给朋友演示一个真能跑的 AI 工作流 — 聊天、搜索、笔记、出图、视频、PPT、会议记录、写作 — 都在你自己的电脑或浏览器里跑。
八件事:
- 聊天 — 问什么答什么。Open WebUI
- 搜索 — 找真实信息,带出处。Morphic
- 笔记 — 把你的文件变成第二大脑。Khoj
- 出图 — 一句话出图。Fooocus
- 视频 — 自动加字幕。VideoCaptioner
- PPT — 大纲一进,PPT 一出。PPTX skill
- 会议 — 录音 + 转文字 + 总结。Meetily
- 写作 — Notion 风格的 AI 写作板。Novel
推荐安装顺序
顺序是故意排的,每个工具会让下一个更显价值。别跳着装。
- Open WebUI(聊天) — 从这里开始。这是你私人的 ChatGPT 风格窗口,可以接免费本地模型,也可以以后接付费 key。先熟悉敲问题、看回答、按重新生成。第 1 天。
- Morphic(搜索) — 等你被「AI 不知道今天的新闻」气过一次之后,装 Morphic。它是个开源答案引擎,类似 Perplexity 但跑在自己机器上。你会立刻体会到「瞎猜的 AI」和「带证据的 AI」差别有多大。第 2 天。
- Khoj(笔记 / 第二大脑) — 把你的旧 PDF、笔记、收藏夹丢进去,然后问关于你自己东西的问题。这是小白的「啊原来是这样」时刻。第 3 天。
- Fooocus(出图) — 一个窗口一个输入框就出图。项目名字直译就是「专注 prompt 和出图,别折腾工具链」 — 就是给不想学 ComfyUI 节点图的人设计的。第 4 天。
- VideoCaptioner(视频) — 丢一段视频,自动生成字幕、打磨字幕。最快让你感受到「AI 不只能处理文字,还能搞多媒体」。第 5 天。
- PPTX skill(PPT) — 大纲一进,
.pptx一出。周一带去公司,会议室里的反应你会记住。第 6 天。 - Meetily(会议记录) — 本地录音、转文字、出总结 — 音频永远不离开你的电脑。隐私优先比大多数人想的更重要。第 7 天上午。
- Novel(写作) — Notion 风格的编辑器,敲空格就出 AI 续写建议。用它把这一周学的东西写下来。第 7 天晚上 — 你的第一周复盘。
它们怎么协同
┌─────────────┐
│ Open WebUI │ ← 问什么
│ (聊天) │
└──────┬──────┘
│ 需要新鲜事实时
▼
┌─────────────┐
│ Morphic │ ← 带出处的答案
│ (搜索) │
└──────┬──────┘
│ 问题是关于「你自己」的文件时
▼
┌─────────────┐
│ Khoj │ ← 第二大脑
│ (笔记) │
└──────┬──────┘
│
┌─────────────┼─────────────┐
▼ ▼ ▼
┌────────┐ ┌────────┐ ┌────────┐
│Fooocus │ │ Video │ │ PPTX │
│ (出图) │ │Caption │ │ (PPT) │
└────────┘ └────────┘ └────────┘
│
▼
┌─────────────┐
│ Meetily │ ← 录音 + 转写
│ (会议) │
└──────┬──────┘
│ 把学的东西写下来
▼
┌─────────────┐
│ Novel │ ← AI 写作板
│ (写作) │
└─────────────┘
主干是 聊天 → 搜索 → 笔记,这是你以后会反复回来用的核心循环。中间四个媒体工具(Fooocus / VideoCaptioner / PPTX / Meetily)是把 AI 从「聊天搭子」变成「能给同事看的产出」的关键。Novel 收尾 — 把学到的东西写下来,编辑器还会帮你写。
你会遇到的取舍
- 免费 vs 付费 — 这个 pack 里每个工具都有免费路径。但你最终会想给 Open WebUI 接一个付费模型(Claude 或 GPT)才能感受到真正的天花板。坚持用一周后再考虑 ¥150/月预算。别提前付费。
- 隐私 — Meetily 和 Khoj 完全本地处理 — 你的会议和笔记不离开机器。Open WebUI 和 Morphic 可以全本地或者调付费 API,按工具决定,不用一刀切。
- 中文支持 — Open WebUI、Khoj、Novel、VideoCaptioner 中文都不错。Fooocus 提示词用英文出图效果更好(你可以用英文写 prompt,输出还是你想要的画面)。PPTX skill 出什么语言取决于你大纲什么语言。
- 学习曲线 — Open WebUI / Morphic / Novel / Fooocus 都是10 分钟内出结果。Khoj 和 Meetily 约 30 分钟(你要索引自己的文件 / 配音频)。VideoCaptioner 看视频长度。PPTX skill 需要在 AI agent(Claude Code)里调用 — 最「技术」的一个,但回报最大。
常见踩坑
- 别全信 AI 说的事实,自己要核。最好的模型也会胡说。所以 Morphic(带出处)排在第 2 位 — 训练自己的核查习惯。
- 别把 prompt 不会写的锅甩给工具。小白第一大失败模式:敲一句话就放弃。试试:角色 + 任务 + 限制 + 例子。好 prompt 比好模型管用 90% 的场景。
- 别以为「免费 = 不行」。Open WebUI + 本地模型(通过 Ollama)能搞定 70% 的日常问题。触到天花板再付费,不是上来就付。
- AI 出图涉及版权 — 真人 / 知名 IP 的图别公开发,肖像权和版权规则照样适用。Fooocus + Stable Diffusion 给你能力,责任在你。
- 国内访问问题 — 在中国大陆:Open WebUI + Khoj + Meetily + VideoCaptioner 都能不挂梯子直接用(本地跑)。Morphic + Novel + 国外云模型可能需要代理。网络问题别赖工具。
8 个资产打包就绪
常见问题
应该先学哪个?
Open WebUI。花一个专注小时纯聊天 — 同一个问题用三种问法、按重新生成、并排比两个模型 — 这种直觉是后面所有工具的基础。别第一天就装全 8 个,那是最快放弃整套的路径。一天一个工具最合适。
ChatGPT vs 文心 / 豆包 / 通义 — Open WebUI 里接哪个?
中文场景:通义千问 / DeepSeek / 豆包都有强力的免费或低价 API,Open WebUI 兼容任何 OpenAI 风格 API。正确答案是「试两个用一周,看你不假思索时会伸手去用哪个」 — 不是「读评测读一小时」。先把 Open WebUI 跑起来比选哪个模型重要 10 倍。
免费版真的够用吗?
第一个月够。Open WebUI + 本地模型能搞定日常问答。Morphic 和 Khoj 本地跑免费。Fooocus 免费。VideoCaptioner 免费。Novel 免费。唯一可能需要付费的是一个月后给 Open WebUI 接 Claude 或 GPT 的 API key(轻度用约 ¥70-150/月),那时你已经能感受到本地模型在某些具体任务上的天花板。
学多久能用熟?
两周日用,每天 30 分钟。第一周走完这个 pack 的安装 + 学习循环。第二周开始你会不自觉地放下 Google 去问 AI。到第二个月,你会安静地养成 5 个小习惯 — 每天问题倒进 Khoj、PPT 走 PPTX skill、会议走 Meetily — 不知不觉就复利了。陷阱是第三天就期待奇迹。
数据安全吗?
大体安全,前提是你坚持本地。Meetily 和 Khoj 本地处理。Open WebUI 自托管。Fooocus 跑你自己的 GPU。默认会出数据的两个:Morphic(搜索词发给你选的搜索后端)和你接到 Open WebUI 的付费 API 模型(prompt 发给 OpenAI / Anthropic)。上传任何敏感东西前先读对应工具的数据政策。