简介
Promptfoo 是一个开源 LLM 评估和红队测试框架,GitHub 5,000+ stars。跨多个模型测试提示词,检测越狱和注入攻击,用断言衡量输出质量,在上线前捕获回归。可以理解为 LLM 的 pytest。适合构建生产 LLM 应用并需要质量保证和安全测试的团队。
Open-source framework for evaluating and red-teaming LLM applications. Test prompts across models, detect jailbreaks, measure quality, and catch regressions. 5,000+ GitHub stars.
这里应该同时让用户和 Agent 知道第一步该复制什么、安装什么、落到哪里。
npm install -g promptfoo
promptfoo init
promptfoo evalPromptfoo 是一个开源 LLM 评估和红队测试框架,GitHub 5,000+ stars。跨多个模型测试提示词,检测越狱和注入攻击,用断言衡量输出质量,在上线前捕获回归。可以理解为 LLM 的 pytest。适合构建生产 LLM 应用并需要质量保证和安全测试的团队。