Main
用于“过夜优化”:README 描述循环会打分断言、修改 SKILL.md,只有分数提升才 commit,否则 reset。
把
eval.json当基准:用二值断言(真/假)降低主观性,才能稳定优化。先用
--dry-run只评分不改 git,确认行为可靠后再开启自动提交。目标技能需在 git 仓库中;README 说明回滚依赖 git reset/commit 机制。
Source-backed notes
- README 把它描述为 Karpathy autoresearch 的 Claude Code 改编版,并用二值断言作为评分机制。
- README 给出通过链接 agents/commands 的安装方式,并用
/autoimprove作为统一入口。
FAQ
- 会改写提交历史吗?:可能会 commit/reset;不确定就先
--dry-run,或在分支里运行。 - 需要 Python 脚本吗?:README 表示只用 Claude Code agents + commands 即可运行,无需外部 Python。
- 优化指标是什么?:eval.json 的二值断言通过率;断言要精确、可检查。