个人知识库 — 让 AI 读你的笔记、日记、PDF
十件开源资产,把 AI 接到你自己的笔记、日记和 PDF 归档上 — 全程私有。笔记 app、MCP/agent 桥、本地索引器、纸质文档 OCR、文献管理。真正属于你的 second brain。
这个 pack 包含什么
这是当你想让 AI 读你自己的笔记 —— 日记、会议记录、写一半的随笔、读研时囤的 PDF —— 并回答相关问题,又不想把任何东西传到云端时,会搭的那套栈。
这跟「找前沿模型聊天」是两件事。那边要的是推理能力;这边要的是对你私有语料的召回。你不需要 GPT-5 —— 你需要管道:一个把内容存成明文 Markdown 的笔记 app、一个能读你历史上所有格式的索引器、一个让 AI 查到笔记的 MCP 或 agent 桥、再加一个聊天前端。
这个 pack 不等于 TokRepo 上已有的 local-first-ai pack —— 那一套搭的是完整私有 AI 工作流(Ollama、Open WebUI、ComfyUI、出图、转写)。这一套只聚焦在个人 RAG 这一层,把它做深:笔记存哪、怎么被索引、agent 怎么读到。
推荐安装顺序
- Logseq — 大纲式、隐私优先的笔记 app。本地 Markdown 文件、可选加密同步、日记是一等公民。如果还没有信得过的笔记 app,从这里开始。不选 Notion 或 Bear 的原因:每条笔记都是磁盘上明文文件,下游任何工具都能读。
- Obsidian Agent Client — 已经是 Obsidian 用户的话,这个插件把 ACP 协议的 agent(Claude Code、Codex、Gemini)直接接进编辑器。你的 vault 就是 agent 的上下文。通过 BRAT 或 releases 安装。
- Obsidian MCP Tools — Obsidian 的另一条路:不是把 agent 拉进 Obsidian,而是把 Obsidian 暴露给 Claude Desktop —— 一个本地 MCP server。Claude 现在能查 vault、搜笔记、跑 dataview 查询。如果 Claude Desktop 是你日常主力,选这个。
- joplin-mcp — 给 Joplin 用户的同款方案。MCP server,让任何兼容 Claude Desktop 的客户端读写你的 Joplin 笔记。Joplin 可选 E2EE + 本地 MCP,笔记完全不出本机。
- Cherry Studio 知识库 — 一站式选项。带本地 RAG 引擎的桌面 AI 客户端,能吃 50+ 格式(PDF、Markdown、DOCX、EPUB、网页、甚至 Notion 导出),本地 embedding,再喂给你连的任何 LLM。想用一个 app 而不是五个,从这里开始。
- Trilium Notes — 自托管的层级 KB,带脚本、属性搜索、真正的树形结构。Logseq 的平铺图谱模型走到头之后接它。如果你的脑子按大纲组织,又想每条笔记都能作为结构化数据被查询,是对的选择。
- Blinko — 自托管的个人 AI 笔记,RAG 已经内置。不用自己接索引器,开箱即用。更接近「私有 NotebookLM」而不是「Obsidian + 插件」。代价:可定制性弱,但开箱可用。
- Zotero — 文献管理器。是你的笔记和学术 / PDF 世界之间的桥。自动从论文抓元数据、建可搜索的文献库、暴露本地 API,下游 RAG 工具(Cherry Studio、自写脚本)能索引它。
- Paperless-ngx — 带 OCR 的自托管文档管理。大多数知识库方案漏掉的一块:每张纸质账单、合同、收据扫描、OCR、打标、索引。然后 AI 才能回答「我 2024 年 3 月的电费是多少」 —— 你一个 PDF 都不用翻。
- Memos — 轻量自托管笔记。Twitter 式短捕捉,带标签可搜索。微博体日记层 —— 捕捉那些小到不该进 Logseq 但又重要到不能丢的想法。
它们怎么协同
┌────────────────────────────────────────────────────────┐
│ 你的私有语料(一切落盘,不上传) │
└────────────────────────────────────────────────────────┘
│ │ │ │
Logseq Obsidian Joplin Trilium
Memos (或一站式 Blinko)
│ │ │ │
│ ├─ Obsidian Agent Client(编辑器内 ACP)
│ ├─ Obsidian MCP Tools ──► Claude Desktop
│ │
│ └─ joplin-mcp ──► Claude Desktop
│
└──► Cherry Studio 知识库 ──┐
│
Zotero(论文) ─────────────► ├──► 本地 LLM / Claude / GPT
Paperless-ngx(扫描 PDF)────► │ (你自己选模型)
▼
跟知识库对话
模式:笔记 app 存原文,桥层(MCP server、agent 插件、内置 RAG 引擎)让它可查,LLM 客户端负责问。不用全装 —— 选跟你已有的笔记 app 对应的那一行,再按需加 Zotero 和 Paperless-ngx,如果你的知识不全在 Markdown 里。
你会遇到的取舍
- MCP 桥 vs app 内 agent vs 一站式 —— 三种架构都成立。MCP 桥(Obsidian MCP Tools、joplin-mcp)保留你现有的笔记 app,让 Claude Desktop 伸手进来;适合有固定客户端的重度用户。app 内 agent(Obsidian Agent Client、Blinko)把 AI 塞进编辑器;适合想让答案紧贴原文的人。一站式(Cherry Studio、Blinko)把索引器 + 聊天 + 模型打包;适合不想维护三个工具的人。
- embedding 质量 vs 配置痛苦 —— 省事路径:用笔记 app 自带的索引器(Blinko、Cherry Studio)。高质量路径:通过 Ollama 跑 BGE-M3 或 nomic-embed-text,再把自己写的 RAG 管道指向 vault。多数人高估了召回质量对个人笔记的重要性 —— 语料体量小,你大概也记得答案在哪一带。先简单做。
- 聊天层用前沿模型 vs 本地模型 —— RAG + Claude 4.5 / GPT-5 综合质量最好。RAG + 本地 Llama 3.1 8B 日记 100% 私有,但综合能力明显弱。混合方案没问题:检索完全本地(笔记的 embedding 永远不出机器),只把 top-3 chunk 加你的问题发给前沿模型。
- PDF 是隐藏杀手 —— Markdown 笔记几秒就索引完。扫描 PDF 要 OCR(Paperless-ngx),学术 PDF 要懂版式的抽取(Zotero 管引用元数据;要做全文 RAG 可能还得在前面加 GROBID 或 unstructured.io)。任何非文本源都要单独规划一遍处理。
常见踩坑
- 一上来就全索引 —— 一万个文件的 vault 配上烂的 chunking 策略,给你的是一万段没用的 4 行片段。从一个子文件夹开始(比如今年的会议记录),测一下召回质量,再扩展。
- 日记噪音淹没真正的知识 —— 如果每天又往同一个 vault 灌 2 KB 站会笔记,召回结果天天是昨天的待办。把语料分开:日常日记放 Logseq,长期笔记放 Obsidian,只索引长期 vault。
- MCP server 要权限太狠 —— MCP 给 AI 的能力很大。装之前先读每个 server 的权限清单。joplin-mcp 和 Obsidian MCP Tools 默认都是读 + 写;先用只读模式跑通流程再开写。
- 烂扫描的 OCR 质量 —— Paperless-ngx 不错但不是魔法。手机斜着拍的 30 度收据回来是乱码。要真正可搜的东西用平板扫描仪,或 iOS Notes 的扫描功能(自动校正)。
- 忘了备份 vault —— 这整套的意义就是这是你的 second brain。加密 + 备份到自己存储(Syncthing、私有 rsync target、Joplin 自带服务器)。十年日记别全压在一台笔记本上。
10 个资产打包就绪
常见问题
我已经在用 Obsidian — 这套里哪些是真需要的?
Obsidian 是你的根据地的话,pack 里有两条路,都收了。路径 A:装 Obsidian Agent Client,把 agent 接进编辑器 — 适合让 AI 的回答紧挨着你正在写的笔记。路径 B:装 Obsidian MCP Tools,让 Claude Desktop(或任何 MCP 客户端)从外面查你的 vault — 适合想要独立的聊天面板,vault 只是知识源。重度用户最后通常两个都跑。pack 里其他笔记 app 跳过 — 那些是给还没选定的人的。
聊天层用 Claude 或 GPT,这还算真隐私吗?
部分算。本地索引器(Cherry Studio 的 RAG 引擎、MCP server、笔记文件系统)让全部语料留在盘上。提问时只有 top-K 召回的 chunk 加你的 prompt 发给模型方。比起把整个 vault 上传到 ChatGPT,数据量降了几个数量级 — 但不是零。要全私有,把聊天层走 Ollama 的本地模型(参考 local-first-ai pack)。现实折中:用 Claude/GPT 做综合,但永远别把真敏感内容(医疗、法律、隐私)放进被索引的文件夹。
这套跟已有的 local-first-ai pack 区别在哪?
local-first-ai 是完整个人 AI 套件:聊天(Open WebUI)、代码(Continue)、出图(ComfyUI)、转写(Faster Whisper)+ Khoj 和 Joplin 作为知识层。这个 pack 是「个人 RAG」这一层的窄切片,往深做:多种笔记 app 选项(Logseq / Obsidian / Trilium / Blinko / Memos)、让 Claude Desktop 读 vault 的 MCP 桥(Obsidian MCP Tools / joplin-mcp)、纸质文档扫描(Paperless-ngx)、学术研究(Zotero)。没有 model runner —— 模型从 local-first-ai 借,或者让 Cherry Studio 接任何 API。
能用在 PDF 和纸质扫描件上吗,不只是 Markdown?
可以,所以 Paperless-ngx 和 Zotero 才进了 pack。Paperless-ngx 对扫描的收据、合同、账单、税务文档跑 OCR,再暴露可搜的索引。Zotero 处理学术 PDF,抽取元数据、存全文。Cherry Studio 知识库可以直接吃这两种格式。再冷门点的格式(EPUB / DOCX / 网页归档)Cherry Studio 开箱支持 50+ 种。模式:任何格式最终变成文本、文本变成 embedding、embedding 变成可搜。PDF 只是最慢的那一步。
不想装十个工具的话,最小可用配置是什么?
三个工具,按顺序:(1) 你真会每天用的笔记 app —— 从头开始选 Logseq,否则继续用 Obsidian 或 Joplin;(2) 跟它对应的桥层 —— Obsidian 选 Obsidian Agent Client 或 Obsidian MCP Tools、Joplin 选 joplin-mcp、想要一个 app 干所有事就直接 Cherry Studio;(3) 有一堆要可搜的纸质文档就加 Paperless-ngx。这是最小可跑的个人 RAG。研究者再加 Zotero、喜欢微博式捕捉再加 Memos、笔记 app 用到吃力再考虑换 Trilium 或 Blinko。