什么是这个 Skill?
教 AI Agent 使用 Together AI 的评估框架,LLM-as-a-judge 自动评分模型输出。
一句话总结:Together AI 评估 Skill,LLM-as-a-judge 评分质量/安全/准确度,官方出品。
来源与致谢
togethercomputer/skills — MIT
Skill that teaches Claude Code Together AI's LLM evaluation framework. Run LLM-as-a-judge evaluations to score model outputs on quality, safety, and task completion.
这里应该同时让用户和 Agent 知道第一步该复制什么、安装什么、落到哪里。
npx skills add togethercomputer/skills教 AI Agent 使用 Together AI 的评估框架,LLM-as-a-judge 自动评分模型输出。
一句话总结:Together AI 评估 Skill,LLM-as-a-judge 评分质量/安全/准确度,官方出品。
togethercomputer/skills — MIT