TOKREPO · 主题包

稳定

个人知识库 — 让 AI 读你的笔记、日记、PDF

十件开源资产，把 AI 接到你自己的笔记、日记和 PDF 归档上 — 全程私有。笔记 app、MCP/agent 桥、本地索引器、纸质文档 OCR、文献管理。真正属于你的 second brain。

10 个资产

关于这个主题包

这个 pack 包含什么

这是当你想让 AI 读你自己的笔记 —— 日记、会议记录、写一半的随笔、读研时囤的 PDF —— 并回答相关问题，又不想把任何东西传到云端时，会搭的那套栈。

这跟「找前沿模型聊天」是两件事。那边要的是推理能力；这边要的是对你私有语料的召回。你不需要 GPT-5 —— 你需要管道：一个把内容存成明文 Markdown 的笔记 app、一个能读你历史上所有格式的索引器、一个让 AI 查到笔记的 MCP 或 agent 桥、再加一个聊天前端。

这个 pack 不等于 TokRepo 上已有的 local-first-ai pack —— 那一套搭的是完整私有 AI 工作流（Ollama、Open WebUI、ComfyUI、出图、转写）。这一套只聚焦在个人 RAG 这一层，把它做深：笔记存哪、怎么被索引、agent 怎么读到。

它们怎么协同

  ┌────────────────────────────────────────────────────────┐
  │  你的私有语料（一切落盘，不上传）                      │
  └────────────────────────────────────────────────────────┘
     │           │              │              │
  Logseq      Obsidian        Joplin         Trilium
  Memos       （或一站式 Blinko）
     │           │              │              │
     │           ├─ Obsidian Agent Client（编辑器内 ACP）
     │           ├─ Obsidian MCP Tools  ──► Claude Desktop
     │                          │
     │                          └─ joplin-mcp ──► Claude Desktop
     │
     └──► Cherry Studio 知识库  ──┐
                                  │
  Zotero（论文）  ─────────────► ├──► 本地 LLM / Claude / GPT
  Paperless-ngx（扫描 PDF）────► │     （你自己选模型）
                                  ▼
                            跟知识库对话

模式：笔记 app 存原文，桥层（MCP server、agent 插件、内置 RAG 引擎）让它可查，LLM 客户端负责问。不用全装 —— 选跟你已有的笔记 app 对应的那一行，再按需加 Zotero 和 Paperless-ngx，如果你的知识不全在 Markdown 里。

你会遇到的取舍

MCP 桥 vs app 内 agent vs 一站式 —— 三种架构都成立。MCP 桥（Obsidian MCP Tools、joplin-mcp）保留你现有的笔记 app，让 Claude Desktop 伸手进来；适合有固定客户端的重度用户。app 内 agent（Obsidian Agent Client、Blinko）把 AI 塞进编辑器；适合想让答案紧贴原文的人。一站式（Cherry Studio、Blinko）把索引器 + 聊天 + 模型打包；适合不想维护三个工具的人。
embedding 质量 vs 配置痛苦 —— 省事路径：用笔记 app 自带的索引器（Blinko、Cherry Studio）。高质量路径：通过 Ollama 跑 BGE-M3 或 nomic-embed-text，再把自己写的 RAG 管道指向 vault。多数人高估了召回质量对个人笔记的重要性 —— 语料体量小，你大概也记得答案在哪一带。先简单做。
聊天层用前沿模型 vs 本地模型 —— RAG + Claude 4.5 / GPT-5 综合质量最好。RAG + 本地 Llama 3.1 8B 日记 100% 私有，但综合能力明显弱。混合方案没问题：检索完全本地（笔记的 embedding 永远不出机器），只把 top-3 chunk 加你的问题发给前沿模型。
PDF 是隐藏杀手 —— Markdown 笔记几秒就索引完。扫描 PDF 要 OCR（Paperless-ngx），学术 PDF 要懂版式的抽取（Zotero 管引用元数据；要做全文 RAG 可能还得在前面加 GROBID 或 unstructured.io）。任何非文本源都要单独规划一遍处理。

常见踩坑

一上来就全索引 —— 一万个文件的 vault 配上烂的 chunking 策略，给你的是一万段没用的 4 行片段。从一个子文件夹开始（比如今年的会议记录），测一下召回质量，再扩展。
日记噪音淹没真正的知识 —— 如果每天又往同一个 vault 灌 2 KB 站会笔记，召回结果天天是昨天的待办。把语料分开：日常日记放 Logseq，长期笔记放 Obsidian，只索引长期 vault。
MCP server 要权限太狠 —— MCP 给 AI 的能力很大。装之前先读每个 server 的权限清单。joplin-mcp 和 Obsidian MCP Tools 默认都是读 + 写；先用只读模式跑通流程再开写。
烂扫描的 OCR 质量 —— Paperless-ngx 不错但不是魔法。手机斜着拍的 30 度收据回来是乱码。要真正可搜的东西用平板扫描仪，或 iOS Notes 的扫描功能（自动校正）。
忘了备份 vault —— 这整套的意义就是这是你的 second brain。加密 + 备份到自己存储（Syncthing、私有 rsync target、Joplin 自带服务器）。十年日记别全压在一台笔记本上。

安装 · 一行命令

$ tokrepo install pack/personal-knowledge-base-rag

丢给 agent，或粘到终端

包内含什么

10 个资产打包就绪

Script#01

Logseq — Privacy-First Knowledge Management Platform

Logseq is a privacy-first, open-source platform for knowledge management and collaboration. Outliner-based with bidirectional links, block references, queries, and graph visualization. Local-first with optional sync. The open-source alternative to Roam Research.

by Script Depot·498 views

$ tokrepo install logseq-privacy-first-knowledge-management-platform-42404795

Agent#02

Obsidian Agent Client — Bring Agents into Obsidian

Obsidian Agent Client adds ACP-based agent integrations (Claude Code/Codex/Gemini) to Obsidian; install via BRAT or Releases and use adapters (2,016★).

by Agent Toolkit·250 views

$ tokrepo install obsidian-agent-client-bring-agents-into-obsidian

MCP#03

Obsidian MCP Tools — Notes-to-Tools for Claude

Obsidian MCP Tools adds a local MCP server via an Obsidian plugin, so Claude Desktop can query and automate your vault with a signed server component.

by MCP Hub·102 views

$ tokrepo install obsidian-mcp-tools-notes-to-tools-for-claude

MCP#04

joplin-mcp — MCP Server for Joplin Notes

joplin-mcp is an MCP server for Joplin that lets agents read/search/edit notes; includes an installer for Claude Desktop and a Claude Code plugin.

by MCP Hub·83 views

$ tokrepo install joplin-mcp-mcp-server-for-joplin-notes

Skill#05

Cherry Studio Knowledge Base — Local RAG with 50+ Formats

Cherry Studio Knowledge Base ingests PDFs, Office docs, Markdown into a local vector index. Query offline, BYOK any LLM. Data stays on your machine.

by Cherry Studio·398 views

$ tokrepo install cherry-studio-knowledge-base-local-rag-with-50-formats

Script#06

Trilium Notes — Self-Hosted Hierarchical Knowledge Base

Trilium Notes is a self-hosted, hierarchical note-taking application with rich editing, note cloning, relation maps, and scripting capabilities.

by Script Depot·183 views

$ tokrepo install trilium-notes-self-hosted-hierarchical-knowledge-base-677aaba2

Skill#07

Blinko — Self-Hosted Personal AI Note-Taking Tool

An open-source, self-hosted personal note-taking tool with AI-powered tagging, search, and organization, built with Next.js and PostgreSQL.

by Script Depot·286 views

$ tokrepo install blinko-self-hosted-personal-ai-note-taking-tool-44641b25

Skill#08

Zotero — Free Research Source Manager and Citation Tool

Zotero is a free, open-source reference management tool that helps you collect, organize, annotate, cite, and share research sources. Available on Windows, macOS, Linux, and iOS, it supports one-click saving from browsers and generates citations in thousands of styles.

by AI Open Source·218 views

$ tokrepo install zotero-free-research-source-manager-citation-tool-74dca4cd

Skill#09

Paperless-ngx — Self-Hosted Document Management with OCR

Paperless-ngx is an open-source document management system that scans, OCRs, indexes, and archives all your physical and digital documents for full-text search.

by Script Depot·444 views

$ tokrepo install paperless-ngx-self-hosted-document-management-ocr-de0041a5

Skill#10

Memos — Open Source Self-Hosted Note-Taking Tool

Memos is a lightweight, self-hosted note-taking app with Markdown support, tag-based organization, and a Twitter-like timeline interface for quick idea capture.

by Script Depot·230 views

$ tokrepo install memos-open-source-self-hosted-note-taking-tool-d4bf6827

常见问题

我已经在用 Obsidian — 这套里哪些是真需要的？

Obsidian 是你的根据地的话，pack 里有两条路，都收了。路径 A：装 Obsidian Agent Client，把 agent 接进编辑器 — 适合让 AI 的回答紧挨着你正在写的笔记。路径 B：装 Obsidian MCP Tools，让 Claude Desktop（或任何 MCP 客户端）从外面查你的 vault — 适合想要独立的聊天面板，vault 只是知识源。重度用户最后通常两个都跑。pack 里其他笔记 app 跳过 — 那些是给还没选定的人的。

聊天层用 Claude 或 GPT，这还算真隐私吗？

部分算。本地索引器（Cherry Studio 的 RAG 引擎、MCP server、笔记文件系统）让全部语料留在盘上。提问时只有 top-K 召回的 chunk 加你的 prompt 发给模型方。比起把整个 vault 上传到 ChatGPT，数据量降了几个数量级 — 但不是零。要全私有，把聊天层走 Ollama 的本地模型（参考 local-first-ai pack）。现实折中：用 Claude/GPT 做综合，但永远别把真敏感内容（医疗、法律、隐私）放进被索引的文件夹。

这套跟已有的 local-first-ai pack 区别在哪？

local-first-ai 是完整个人 AI 套件：聊天（Open WebUI）、代码（Continue）、出图（ComfyUI）、转写（Faster Whisper）+ Khoj 和 Joplin 作为知识层。这个 pack 是「个人 RAG」这一层的窄切片，往深做：多种笔记 app 选项（Logseq / Obsidian / Trilium / Blinko / Memos）、让 Claude Desktop 读 vault 的 MCP 桥（Obsidian MCP Tools / joplin-mcp）、纸质文档扫描（Paperless-ngx）、学术研究（Zotero）。没有 model runner —— 模型从 local-first-ai 借，或者让 Cherry Studio 接任何 API。

能用在 PDF 和纸质扫描件上吗，不只是 Markdown？

可以，所以 Paperless-ngx 和 Zotero 才进了 pack。Paperless-ngx 对扫描的收据、合同、账单、税务文档跑 OCR，再暴露可搜的索引。Zotero 处理学术 PDF，抽取元数据、存全文。Cherry Studio 知识库可以直接吃这两种格式。再冷门点的格式（EPUB / DOCX / 网页归档）Cherry Studio 开箱支持 50+ 种。模式：任何格式最终变成文本、文本变成 embedding、embedding 变成可搜。PDF 只是最慢的那一步。

不想装十个工具的话，最小可用配置是什么？

三个工具，按顺序：(1) 你真会每天用的笔记 app —— 从头开始选 Logseq，否则继续用 Obsidian 或 Joplin；(2) 跟它对应的桥层 —— Obsidian 选 Obsidian Agent Client 或 Obsidian MCP Tools、Joplin 选 joplin-mcp、想要一个 app 干所有事就直接 Cherry Studio；(3) 有一堆要可搜的纸质文档就加 Paperless-ngx。这是最小可跑的个人 RAG。研究者再加 Zotero、喜欢微博式捕捉再加 Memos、笔记 app 用到吃力再考虑换 Trilium 或 Blinko。

更多主题包

12 个主题包 · 80+ 精选资产

回首页浏览全部精选合集

返回主题包总览