财务会计 AI 工具包
十件给会计、FP&A 分析师、小公司 CFO 把 AI 真的接到账上的工具:收据 OCR、表格自动化、纯文本账本、开票、建模 agent、报表面板。围绕可审计链路而不是聊天框。
这个 pack 包含什么
这是给真的要做月结的人准备的栈 — 小公司的会计、A 轮 startup 一人 FP&A 团队、董事会间隙还得对账的 CFO。不是推特上「30 个 AI 财务创业公司」清单。每个工具只做月结流水线里的一件事:把纸变成数据、进可审计的容器、分类分析、做未来预测、出报表。
整个 pack 围绕一条铁律:AI 加速干活,审计链路不能动。所以账本选纯文本(hledger)而不是黑盒 SaaS;分类层选可以自己审的自托管应用(TaxHacker)而不是别人家 API;表格层让 agent 编辑你现有的工作簿,而不是替你换一个。
推荐安装顺序(采集 → 分类 → 分析 → 预测 → 报告)
- Zerox — Zero-Shot PDF OCR for AI Pipelines — 从这里起步。收据、供应商发票、银行流水都是 PDF 和 JPG。Zerox 用视觉模型一次抽出结构化数据,不用训模板。这是前门。
- Marker — Convert PDF to Markdown with High Accuracy — Zerox 对单张收据很强;Marker 在长文档(多页对账单、10-K、审计报告)上更稳。输出 markdown,表格还在。两个搭配用。
- Claude Official Skill: XLSX — Spreadsheet Operations — 数据结构化之后你需要工作簿。Claude 官方 skill 干净地读写
.xlsx,公式格式都保留。这是从「原始抽取」到「可以给老板看的东西」之间的桥。 - Excel MCP Server — Edit .xlsx Without Excel — 同样能力以 MCP 暴露给本地 agent。Claude Code 或 Cursor 可以打开你的月结工作簿、追加行、重算合计、保存 — 你不用离开聊天框。期末重复劳动这一块是刚需。
- TaxHacker — Self-Hosted AI Accounting for Receipts and Invoices — 自托管应用,扫收据、用 LLM 分类、多币种记账。自定义 prompt 意味着你可以按自家科目表调它。不把数据交给外面厂商的分类层。
- Hledger — Robust Plain-Text Accounting Tool — 审计骨架。每笔分类后的交易落到纯文本账本,可以
git diff、可以 review、可以回滚。复式记账、对账、资产负债表、损益 — 全从一个你真正拥有的文件出。 - Invoice Ninja — Open Source Invoicing and Payments — 应收侧。发开票、追收款、应收账款回流到
hledger。自托管,客户数据留在你自己服务器。 - Claude Code Agent: Quant Analyst — 金融建模专家子 agent。估值、情景分析、敏感性表、DCF 都用它。当你的数据在 XLSX/
hledger里干净的时候,FP&A 苦力交给这个 agent 跑。 - Claude Code Agent: Report Generator — 月度董事会 deck、差异分析评述、数字背后的叙事。Quant Analyst 给你模型;Report Generator 给你那一页 slide。
- Dash — Data Apps and Dashboards in Pure Python — 常驻视图。损益看板、现金跑道追踪、应收账龄报表,用纯 Python 写一次,定时刷新。从此告别「再发我一份最新表」。
它们怎么协同
纸质 / PDF / JPG
│
┌─────┴──────┐
▼ ▼
Zerox Marker
(单张) (多页对账单/
长报告)
│ │
└─────┬──────┘
▼
结构化行 / markdown
│
┌─────┴──────────┐
▼ ▼
Claude XLSX TaxHacker
(工作簿) (分类 +
│ 科目编码)
Excel MCP │
(agent 编辑) ▼
│ Hledger
└─────┬─────(审计链路)
▼ ▲
Invoice Ninja ───────┘
(应收回流)
│
▼
┌──── Quant Analyst ────┐
│ (建模、敏感性) │
└────┬───────────────────┘
▼
Report Generator Dash
(董事会文本) (实时看板)
关键连接是 Hledger + agent 群:只要 source of truth 是一个纯文本文件,你就能让 agent 只读地看它、在上面建模、写报告 — 但永远不给它账本的写权限。可审计数据上跑只读 AI,是这一切的安全形态。
你会遇到的取舍
- AI 分类 vs 规则分类 — TaxHacker(或任何 LLM 分类器)能 90% 准确猜你的科目表,但悄悄错 10%。规则分类(
hledger的auto-postings、正则规则)很无聊但可重现。最佳实践:可预测的 80% 走规则,长尾才让 LLM 上。永远要 review。 - 月结 vs 持续结 — 自动化会诱惑你「天天结」。前一个季度先抵抗住,先按月结的节奏跑前三次,搞清楚分类在哪里失败。之后再上持续结,把人工 review 换成异常检测。
- 敏感数据自托管 vs SaaS — 除了 Claude agent,这个 pack 里所有工具都能自托管。这是故意的。供应商发票和工资数据正是你不想流到无法审计的 SaaS 的那种数据。花 1-2 小时配 Docker,省年底跟客户解释 SOC 2 的麻烦。
- 纯文本会计 vs 金蝶/用友/QuickBooks —
hledger不妥协、界面难看。金蝶/用友友好但是花园围墙。如果你的业务每周 <20 笔,能看懂文本,hledger在可审计性上赢。如果有员工需要录入发票,留在金蝶/用友,让 AI agent 读它的导出 — 不要让会计学 Ledger 语法。
常见踩坑
- AI 编数字 — 金融 AI 最危险的失败模式。让 LLM 总结一份 P&L,它会编造看起来合理的科目。缓解:永远不让 agent 直接产数字;让它产查询(SQL、hledger 命令、公式),确定性地跑出结果,再解释返回值。
- 没有审计链路 — 三个月后你回答不了「这笔为什么这天计入这个科目」,审计会很痛。把
hledger账本 commit 到 git、每次月结打 tag、OCR 源 PDF 也放在同一个 repo。无聊的基础设施,救你年终。 - 让 agent 直接写总账 — 不要。Agent 把建议分录写到 staging 文件,人(你)review 之后 commit 到主账本。延迟成本:每周 5 分钟;agent 悄悄翻倍一笔预提的取证成本:6 小时。
- OCR 不复核就用 — Zerox 看到「12.00」可能返回「1,200.00」。OCR 出来的合计永远要和信用卡对账单两路核对。两路对账不是可选项。
- 忘了法律层 — 这个 pack 是编辑指引,告诉你工作流怎么搭。它不替代你的 CPA、税务顾问、当地记账规则。工具让活干得快,不让你合规。任何涉税决策之前,找真人专业人士。
10 个资产打包就绪
常见问题
这些真能给一家正经公司做账,还是只是玩具?
真能用,但有前提。Hledger 从 2007 年起就有公司在用做账;Invoice Ninja 在很多小公司跑生产账单;Zerox 和 Marker 都是生产级 OCR。风险面在 AI 层 — TaxHacker、Claude agent、表格自动化。把这些当初级员工对待:每个输出落账本之前都要 review。这样用,整个 pack 对中小公司账目是安全的。但还不适合监管行业(银行、保险),除非有审计认可的控制层覆盖。
这周就能上的最小版本是啥?
三件套:Zerox(把收据 OCR 成结构化行)+ Claude XLSX skill(把那些行粘进你现有的月结工作簿)+ Hledger(分类后的结果 commit 进纯文本账本)。一个下午就能跑通月结管道。手工分类成为瓶颈时再加 TaxHacker。第一次要做三表模型时再上 Quant Analyst agent。不要一次装完。分类那一步要先按你自家科目表调好,后面的工具才有意义。
为啥用纯文本会计(Hledger)而不是金蝶/用友/QuickBooks?
三个理由:可审计性(每次改动都是 git diff)、AI 友好(agent 可以一个 prompt 读 10MB 的文本账本 — QuickBooks 备份试试)、所有权(厂商涨价或者跑路你的账还在)。代价是新人上手:除了懂财务的工程师,没人想敲 Ledger 语法。如果你有会计住在金蝶里,留下金蝶做录入层,把它的导出灌到 hledger 给 AI 分析。混合架构才是现实答案。
Claude Code agent 真能做 FP&A 工作,还是炒作?
有用,不是魔法。Quant Analyst agent 在以下事情上是真好用:情景表、敏感性分析、在干净数据集上算各种比率、模型文档化、解释别人搭的模型。在以下事情上一般:判断(合理的 churn 假设是多少)、行业特定 benchmark(它不知道你的竞品集)、任何要看私有数据但你没接通的事。把它当高级 associate 用,不是合伙人。模型最终是人签字。
AI 碰账本时,怎么保审计链路?
三条规则。第一,agent 提议、人 commit。每笔 AI 生成的分录落到一个 staging 文件(pending.journal),人 review 之后 git commit 进主账本。第二,源文件跟数据走。收据和发票的 PDF 跟账本放在同一个 git repo,文件名带交易 ID。三个月后你两次点击就能从任意一笔分录追到原始凭证。第三,每次月结打 git tag(例如 close-2026-04)。如果之后要重述,你有一份不可变记录显示当时你结账时账本长什么样。这些都不比一个正常会计已经做的事多 — 同样的内控,套了一层 git 形状的壳。