简介
Instructor 把 LLM 输出直接变成可校验的 Pydantic 模型,并自动重试失败解析。pip install instructor 后即可做 schema-first 抽取,兼容 OpenAI/Anthropic 等。
- 适合谁(Best for): 需要可靠结构化抽取的后端团队,希望拿到可校验的类型结果,避免手写解析器与脆弱正则清洗
- 兼容工具(Works with): Python、Pydantic 模型、OpenAI/Anthropic/Google/Ollama 等提供方(仓库示例)
- 安装时间(Setup time): 8 分钟
量化信息
- GitHub stars(已核验):见「来源与感谢」
- 装机约 8 分钟
- 安装命令:
pip install instructor(仓库)
实战要点
当你已经明确「答案应该长什么样」时,用 Instructor 会非常稳:一次调用对应一个 Pydantic 模型,把字段约束收紧(枚举/范围/必填),再配置重试预算。稳定后,把 schema 当成 API 合同来维护:版本化、补回归样例,并把校验失败率当作质量指标持续监控。
安全提示: Schema 纪律很重要:模型过大、字段语义模糊会带来更多重试,进而拉高延迟与成本。
FAQ
Q: Instructor 解决什么问题? A: 它让 LLM 输出遵循明确的类型/结构(Pydantic),并对不合规输出自动重试,让你拿到稳定的结构化结果而不是靠解析字符串。
Q: 只能配 OpenAI 吗? A: 不是。仓库示例包含 OpenAI、Anthropic、Google 以及本地 Ollama 的 provider 写法,调用方式一致。
Q: 如何降低失败率? A: 把 schema 做小、枚举尽量收敛,并尽量一次只抽取一个对象;schema 越小越容易通过校验、重试次数越少。