简介
为 Node.js 的 LLM 应用接入 OpenTelemetry tracing,定位延迟、工具调用与 RAG 步骤问题;可直接对接标准 OTEL 后端与 Collector,便于统一观测与告警。
- 适合谁(Best for): Node.js 团队,希望对 LLM 调用与工具/RAG 流水线做到 trace 级可观测
- 兼容工具(Works with): Node.js、OpenTelemetry Collector、各类 tracing 后端(Jaeger/兼容 OTEL 的平台)
- 安装时间(Setup time): 14 分钟
量化信息
- 跑通约 14 分钟(npm 安装 + 配 OTEL exporter)
- GitHub stars + forks(已核验):见「来源与感谢」
- 生产建议采样(例如 1/100 请求)把额外开销控制在 <1%
实战要点
好的 trace 要回答两个问题:时间花在哪、失败发生在哪。建议把模型调用、检索、工具执行、输出解析分别做成 span。记录 request_id、模型名与结果状态即可;不要直接记录原始 prompt,改用 hash 或脱敏摘要以兼顾隐私与成本。
安全提示: 把 trace 当敏感数据:脱敏 prompt、屏蔽 PII,并设置合理的留存策略。
FAQ
Q: 它绑定某家平台吗? A: 不绑定。基于 OpenTelemetry,可导出到任意兼容 OTEL 的后端。
Q: 最先追什么? A: 先追 LLM 延迟与 token 使用(若可用),再补检索与工具调用 span。
Q: 怎么控制成本? A: 用采样、脱敏敏感字段,并把 span attributes 控制得更精简。