简介
Markdownify MCP 是一个把 PDF/图片/音频/网页转换成 Markdown 的 MCP server,适合做 RAG/总结前的标准化处理,并支持用路径白名单限制本地文件读取范围。
- 适合谁: 需要把文档(PDF/网页/音频)先转成 Markdown 再总结/索引的 agent
- 可搭配: Bun/Node、可选 Docker、可选
MD_ALLOWED_PATHS路径白名单 - 准备时间: 15–30 分钟
实战建议
- 数据点:Docker 模式可用
MD_ALLOWED_PATHS强制读取边界。 - 量化建议:先只挂载一个目录(例如
/data),减少误读文件的风险。
常用打法:先转换,再总结
让 agent 读各种文档时,建议把管线写清楚: 1)先转 Markdown(标准化), 2)保存 Markdown(缓存), 3)再做总结/切分/索引。
这样解析过程可审计、也避免反复解析。
安全提示
只要涉及本地文件读取,就要做路径限制(allowlist);条件允许时用容器跑转换更稳。
FAQ
支持 PDF 吗?
答:支持,仓库列出了 pdf-to-markdown 等工具。
如何限制读取范围?
答:设置 MD_ALLOWED_PATHS 只允许读取指定目录。
需要用 Docker 吗? 答:如果涉及本地文件,Docker + 只读挂载通常更安全。