简介
Tokentap 给 LLM CLI 工具加上实时 token 仪表盘与 prompt 存档:tokentap start 启动代理与看板,再用 tokentap claude/codex 运行工具即可观察消耗。
- 适合谁: 需要看清 token 消耗与上下文压力的 Claude Code/Codex 等 CLI 重度用户
- 可搭配: Python 3.10+;支持 Claude Code、Codex;Gemini CLI 在 README 中标注受上游问题影响;也支持 OpenAI 兼容供应商
- 准备时间: 5–15 分钟
实战建议
- README:有上下文“油表”(默认 200,000)并把 prompts 存成 Markdown + JSON。
- 适合做回归:对比 prompt/tool 改动前后的 token 消耗。
- 配合护栏:油表到 70–80% 时切换到摘要或检索模式避免爆窗。
主要内容
一个能快速见效的用法:
- 用 Tokentap 跑一段你平时的 CLI 会话。
- 看到消耗飙升时,去 prompt 存档里定位原因:检索 payload、工具输出、还是模板膨胀。
- 一次只改一个点(截断工具输出、去重上下文、减少 boilerplate),然后再量一次。
把 token 当预算管理:把 token 花在“相关证据”上,比重复的模板/闲聊更能提升答案质量。
FAQ
需要装证书吗? 答:README 说明不需要:零配置,本地代理转发;对 OpenAI 兼容供应商用路径前缀路由。
Gemini CLI 能用吗? 答:README 提示当前受上游 OAuth 忽略 base URL 的问题影响;可跟踪链接 issue。
存档应该怎么保存? 答:建议放在私有目录;内容可能含 secrets/代码。要分享日志请先做脱敏。