AI 第二大脑
Logseq 笔记 + Khoj 检索 + Karakeep / Linkwarden 收藏 + AFFiNE 工作区 + MarkItDown 入库器 — 看过的一切汇进可问答的图谱。
这个 pack 装了什么
这个包收齐了六个自建工具,组成可以用 AI 查询的个人知识图谱 —— 就是 Tiago Forte 推广的「第二大脑」模式,加上让大脑真正 有用 而不是「保存文章坟场」的 AI 搜索层。
| # | 资产 | 角色 | 解决什么 |
|---|---|---|---|
| 1 | Logseq | 笔记 | 本地优先的大纲编辑器,双向链接 |
| 2 | Khoj | AI 搜索 | 语义搜索 + 跨笔记和文档对话 |
| 3 | Karakeep | 收藏 | 自建 Pocket 替代品,AI 自动打标签 |
| 4 | Linkwarden | 收藏 | 集合式收藏,整页归档 |
| 5 | AFFiNE | 工作区 | Notion 式块编辑器,带白板模式 |
| 6 | MarkItDown | 入库 | 微软出的工具,PDF / Word / PPT 转干净 Markdown |
Karakeep 和 Linkwarden 分工是故意的:Karakeep 优化 AI 标签和快速捕捉,Linkwarden 优化整页归档(Wayback 式快照,链接失效后知识不丢)。多数人两个一起跑,Karakeep 接日常洪流,Linkwarden 归档正式参考。
为什么现在要做第二大脑
三个变化让这套比 2020 时代「只有 Notion」的方案更有用:
- AI 搜索让笔记值得留。前 LLM 时代,知识库只在你记得它存在 + 能造好查询词时有用。Khoj 的语义搜索让你能问「那篇 RAG 上下文窗口的论文里关于切片说了什么」,即使你存的文件名是
random_pdf_3.pdf也能命中。 - 本地优先意味着隐私不是 tradeoff。Logseq 把图谱存成你掌控的文件夹里的纯 Markdown。Khoj 跑在本地(接 Ollama 之类)—— 私人笔记一字不出机器。Notion AI 每次查询都送到 OpenAI;这套不会。
- MarkItDown 堵上导入缺口。第二大脑最难的一步永远是把输入弄进去。MarkItDown 把 PDF / Word / PPT 甚至 YouTube 转写转成干净 Markdown,Logseq 和 Khoj 原生索引。
一条命令装齐
# 把整个 pack 装进当前项目
tokrepo install pack/ai-second-brain
# 或只装单个
tokrepo install logseq
tokrepo install khoj
TokRepo CLI 给服务端工具配 Docker Compose(Khoj / Karakeep / Linkwarden / AFFiNE),把 Logseq 配置丢进现有图谱目录,把 MarkItDown 装成可 pipe 的 CLI。~/brain/ 目录成为所有东西的标准挂载点。
常见踩坑
- 把 Logseq 页面当文件。在 app 外重命名页面会断双向链接 —— 入向引用还指着旧名字。用 app 内重命名或 Logseq 插件重构;永远别直接
mvmarkdown 文件。 - Khoj 索引整盘。Khoj 默认会索引你指给它的所有东西。别让它扫 ~/Downloads 或工作 git 仓库 —— 索引一个策展的
~/brain/,否则结果嘈杂、重索引慢。 - Karakeep 没有标签策略。AI 自动打标签很好但跨会话不一致。定 10-20 个稳定顶层 tag(
#paper/#tutorial/#tool/#person),让 AI 填子标签。不然一年后会有 400 个一次性标签。 - Linkwarden 每个链接都全页归档。整页归档真吃磁盘(每份 5-50 MB)。只对真想超过链接腐烂期的集合开归档 —— 日常新闻链接不需要。
- AFFiNE 当唯一写作面。AFFiNE 多媒体和白板很好但纯文本导出粗糙。要后续可查询的文字密集工作,在 Logseq 写(原生 Markdown),再把 Logseq 页面嵌进 AFFiNE 排版展示。
推荐工作流
典型的知识捕捉流是这样。浏览器读到一篇文章,Karakeep 扩展抓走,AI 打 #paper #ml。每周一次 triage Karakeep —— 值得留的提到 Linkwarden 永久归档。重要 PDF 走 MarkItDown 进 ~/brain/clippings/。日记和会议纪要在 Logseq 里 [[人名]] [[项目]] 标着。Khoj 整套夜间索引。
要回想时不用记位置。问 Khoj「一月那篇论文里关于 MoE 路由的论证是什么」,它把对的笔记加源 PDF 找出来。
6 个资产打包就绪
常见问题
整套全跑下来收费吗?
不收。六个工具都是宽松或 AGPL 开源;自建。Khoj 在线版收费图方便,但核心引擎接 Ollama 或本地 LLM 免费跑。计算需求适中 —— Logseq 纯客户端,Khoj 索引器树莓派能跑,剩下都是轻量 Docker 容器。存储是变量:Linkwarden 全页归档增长最快。
比 Notion AI / Mem 怎么样?
Notion AI 起步更快、移动 app 更滑,但你写的所有东西都送 OpenAI 跑 AI 功能、送 Notion 服务器存储。这个 pack 给你 80% AI 能力的自建版,零数据离网 —— 代价是自己跑 Docker 容器。Mem 精神接近(AI 原生笔记)但闭源、仅 SaaS。方便压隐私选托管;笔记里有敏感东西选这个 pack。
Claude Code / Cursor 能用吗?
能。Khoj 有 MCP 服务器和 OpenAI 兼容 API,Claude Code 可以把第二大脑当工具查 —— 想让 agent 用你过往研究而不是重新 Google 时很有用。Logseq 有社区 MCP 让 agent 直接读写图谱。TokRepo 资产页按工具单独写好接线。
Karakeep 跟 Linkwarden 区别?
Karakeep 捕捉优先,AI 打标签强、浏览器扩展快 —— 适合每天顺手存的 50 个链接。Linkwarden 归档优先,集合树 + 整页快照 —— 适合策展过、要超过原站的集合。功能重合,但推荐工作流是 Karakeep 当收件箱、Linkwarden 当正式参考。
运维这套的坑?
备份。多数人发现备份策略坏掉是在需要它的时候 —— Logseq 图谱是本地文件(备份目录),Khoj 自带 SQLite + 向量索引(快照数据目录),Karakeep 和 Linkwarden 各跑一个 Postgres。一个夜间任务把四个全快照、复制到 S3 或 B2、每季测一次恢复。pack 自带 backup.sh 模板。