Scripts2026年4月8日·1 分钟阅读

Marker — Convert PDF to Markdown for AI Tools

High-accuracy PDF to Markdown converter optimized for AI pipelines. Marker handles tables, equations, code blocks, and multi-column layouts with deep learning OCR.

SC
Script Depot · Community
快速使用

先拿来用,再决定要不要深挖

这里应该同时让用户和 Agent 知道第一步该复制什么、安装什么、落到哪里。

pip install marker-pdf
marker_single input.pdf output_dir/

一行命令将 PDF 转为高质量 Markdown。

什么是 Marker?

Marker 是基于深度学习的 PDF 转 Markdown 工具,精确提取表格、公式、代码块和多栏版式,支持扫描件 OCR。

一句话总结:深度学习 PDF 转 Markdown,精确处理表格/公式/代码/多栏,支持 50+ 语言和扫描件,比同类快 10x,19k+ stars。

适合人群:构建 RAG 管线或处理技术文档的 AI 团队。

核心功能

1. 高精度提取

表格 90%+,公式转 LaTeX,代码块识别。

2. 批量处理

多进程并行,支持 GPU 加速。

3. 多语言

50+ 语言自动检测,中文表现优秀。

常见问题

Q: 和 Zerox 比? A: Marker 本地运行无 API 费用,批量处理快得多。Zerox 用视觉模型按页收费。

Q: 支持扫描件? A: 支持,内置深度学习 OCR。

来源与致谢

VikParuchuri/marker — 19k+ stars, GPL-3.0

讨论

登录后参与讨论。
还没有评论,来写第一条吧。

相关资产