简介
Logfire 是 Pydantic 团队提供的 Python SDK,用 OpenTelemetry 统一采集 traces/metrics/logs,并以更少的改动获得可观测性;适合把调试、性能与错误定位变成可查询的工程化数据。
- 适合谁: 希望快速把可观测性落地到应用/agent 后端的 Python 团队
- 可搭配: Python 应用(如 FastAPI)与任意兼容 OpenTelemetry 的后端
- 准备时间: 10–30 分钟
实战建议
- 量化建议:1 小时内做到 1 条端到端请求 trace(至少含 DB + HTTP span)。
- 量化建议:对比接入前后 p95 延迟与错误率,观察收益与开销。
Agent 后端提示:把工具调用纳入可观测性
跑 agent 服务时,最快的收益来自把“工具调用”打点:
- 外部 HTTP 请求、
- 数据库查询、
- 向量检索、
- 模型 API 调用。
给 span 统一命名(如 tool.http/tool.sql/tool.vector),才能快速回答“时间与失败都花在哪”。
数据卫生
避免把密钥写进日志/trace。尽早配置脱敏规则,并在生产启用前复核落盘内容。
FAQ
整个平台都开源吗? 答:不是。这个仓库是开源 SDK 与文档;平台端是独立产品。
能导出到别的后端吗? 答:可以。兼容 OpenTelemetry,通常能接入其他 OTel 后端。
优先打点哪些? 答:先做请求链路 + 工具调用,再补齐 DB/HTTP 客户端等自动化集成。