TOKREPO · 主题包
本周新建

老代码库新人上手套件 — 10 年祖传代码不再劝退

你刚入职。代码库 10 年了,80 万行,三个早就没人维护的微服务,唯一懂全栈的人上个月走了。这十个 pick 把 AI agent 变成你的入职搭档:先索引仓库、再画架构、再生成调用图、再总结模块、再标记死代码,最后写出团队一直没有的 CLAUDE.md / AGENTS.md。Codebase Memory MCP + Codebase Explorer + Pattern Finder + ast-index + CodeGraphContext + Graphify + Legacy Modernizer + Technical Debt Manager + CLAUDE.md 模板 + Architect Reviewer。

10 个资产

这个 pack 给谁用

你刚入职。代码库 8 到 12 年了,几十万行,三个半死不活的微服务,命名约定相互冲突,唯一懂全栈的那个人两个月前走了。没有 ARCHITECTURE.md。README 还在引用 Python 2。Wiki 在某个谁也找不着 URL 的 Confluence 上。

这种情境下,一套精心编排的 AI 工具链才真正解决问题 — 不是替你读代码,而是给你一张能用的地图,让入职第一周从「绝望」变成「真正出活」。

这个 pack 对顺序有强烈观点。链条上每个工具产出的工件,是下一个工具的输入。乱装一通你只会得到噪音;按顺序装完,周五之前你就能在脑中跑出整个系统的可工作模型。

推荐安装顺序

  1. Codebase Memory MCP — 先建索引。持久化的代码知识图谱,支持 MCP 的 agent(Claude Code / Cursor / Windsurf)可以直接查。第一天就跑起来,后面所有问题都是查真实索引,而不是 grep 猜。
  2. Claude Code Agent: Codebase Explorer — 宏观地图。扫一遍仓库,输出模块/服务清单:入口在哪、谁调用谁、测试目录长什么样。
  3. Claude Code Agent: Codebase Pattern Finder — 重复模式。挖出重复的写法、自定义的封装、老员工在标准库之上盖的「内部方言」。这里你能学到团队的本地黑话
  4. ast-index — 快速结构化搜索。基于 Tree-sitter 的 CLI,做 AST 级查询(「找出所有以 Y 形参调用 X 的地方」)。要的是结构而不是文本时用它替代 ripgrep。
  5. CodeGraphContext — 调用图变 MCP。把函数和类的关系建成可查图。agent 能回答谁调了它改这个签名会断什么,用的是 edge 不是凭感觉。
  6. Graphify — 仓库级依赖图。在调用图之上叠加模块到模块、文件到文件的 edge。那张你巴不得五年前有人画过的架构图,五分钟生成出来。
  7. Claude Code Agent: Legacy Modernizer — 模块级摘要。读每个模块(配合前面那两张图),写一段话:做什么的、谁在调它、依赖谁、哪里看着不对。存成 docs/modules/*.md,全队会感谢你。
  8. Claude Code Agent: Technical Debt Manager — 死代码和债务。交叉调用图 + git blame + 测试覆盖率,标出不可达代码、关键路径没测试、从 2019 年起没人动过的模块。输出是待 triage 清单,不是 delete 脚本。
  9. Claude Code CLAUDE.md — Best Practices Template — 写下团队一直没有的那份文件。用前面的清单 + 摘要 + 债务表,起草一份 CLAUDE.md(外加一份内容相同的 AGENTS.md 给非 Claude 的 agent),告诉下一个新人「雷在哪儿」。
  10. Claude Code Agent: Architect Reviewer — 你的第一个 PR。真开 PR 前,先让 architect-reviewer agent 跑一遍 diff。它会抓出你不知道存在的约定、你不小心穿过的层、你重命名时打破的公共 API。

这条链怎么产出价值

Codebase Memory MCP  ──┐
                       ├── 共享索引
ast-index ─────────────┤
                       │
Codebase Explorer ─────┤───►  模块/服务清单
Pattern Finder ────────┤───►  团队专属写法
                       │
CodeGraphContext ──────┤───►  调用 edge
Graphify ──────────────┤───►  模块 edge
                       │
Legacy Modernizer ─────┴───►  每模块摘要 (docs/modules/*.md)
Technical Debt Manager ────►  triage 清单 (docs/debt.md)
                            │
                            ▼
        CLAUDE.md  +  AGENTS.md  ◄── 你来写
                            │
                            ▼
         第一个 PR + Architect Reviewer 把关

关键洞察:第 1-6 步补齐结构化上下文 — 团队多年缺的就是这块。第 7-8 步把上下文变成可读散文 + triage 表。第 9 步是真正会被后面工程师(和后面 agent)依赖的写作产出。第 10 步保证你的第一个 PR 不丢人。

你会遇到的取舍

  • 全量索引 vs 增量索引 — Codebase Memory MCP 和 CodeGraphContext 都需要第一次全量索引。百万行仓库首次跑 30-90 分钟很正常。挂夜里跑,剩下一周都是亚秒级查询。
  • MCP server vs CLI — ast-index 本身是 CLI 可独立用;CodeGraphContext 和 Codebase Memory MCP 在 MCP-aware agent 里发挥最大价值。卡在不支持 MCP 的工具上就走 CLI;agent 支持 MCP 就走 MCP。
  • 自动生成文档 vs 手写文档 — Legacy Modernizer 出的模块摘要是初稿不是定稿。当成可编辑的起点,别当成权威。
  • 死代码:标记 vs 删除永远不要让 agent 在 legacy 仓库里删死代码。静态分析会漏 cron 调度的调用方、动态派发和反射。先标,找老员工 review,再人工删。
  • CLAUDE.md vs AGENTS.md — Claude Code 读 CLAUDE.md,通用 agent 读 AGENTS.md。两份文件内容相同两个文件名(软链或单源生成),多工具团队就不会 fork。

常见踩坑

  • 跳过索引步骤 — 后面每个工具都会退化成 grep 质量的输出。别跳
  • 100% 相信调用图 — 反射、依赖注入、YAML 配的路由对静态分析全部不可见。重构热路径前先用 runtime trace 验证。
  • 只用 agent 输出写 CLAUDE.md — 定稿前花 30 分钟找一个老员工聊。他会告诉你三个图永远看不见的雷。
  • 没搞懂就先现代化 — Legacy Modernizer 的名字有挑衅性。先用它做摘要,长远再考虑改造。入职第一周就重写代码 = 必被 revert 的姿势。
  • 第一个 PR 跳过 Architect Reviewer — 第一印象很重要。10 分钟跑一遍 reviewer 抓出的约定问题,能省你三天 code-review 撕逼。
安装 · 一行命令
$ tokrepo install pack/legacy-code-onboarding
丢给 agent,或粘到终端
包内含什么

10 个资产打包就绪

MCP#01
Codebase Memory MCP — Code Intelligence for AI Agents

High-performance code intelligence MCP server. Indexes repos in milliseconds via tree-sitter AST, supports 66 languages, sub-ms graph queries. MIT, 1,300+ stars.

by MCP Hub·220 views
$ tokrepo install codebase-memory-mcp-code-intelligence-ai-agents-a3fe5165
Skill#02
Claude Code Agent: Codebase Explorer

|

by TokRepo精选·24 views
$ tokrepo install claude-code-agent-codebase-explorer-7b3ad600
Skill#03
Claude Code Agent: Codebase Pattern Finder

Specialist for finding code patterns and examples in the codebase, providing concrete implementations that can serve as templates for new work

by TokRepo精选·21 views
$ tokrepo install claude-code-agent-codebase-pattern-finder-bb32e488
Script#04
ast-index — Fast Code Search for Agents

ast-index builds an AST index for fast code search and integrates with Claude/Codex/Cursor; verified 347★ and installs via Homebrew.

by Script Depot·80 views
$ tokrepo install ast-index-fast-code-search-for-agents
MCP#05
CodeGraphContext — Graph Index for Code + MCP

CodeGraphContext indexes a repo into a code graph so developers and agents can query call chains, dependencies, and architecture via CLI or MCP mode.

by MCP Hub·56 views
$ tokrepo install codegraphcontext-graph-index-for-code-mcp
Script#06
Graphify — Repo Knowledge Graph + MCP

Graphify extracts docs/code into a knowledge graph and can install as an MCP/skill across Claude Code, Cursor, Codex, and Gemini CLI. Install via uv/pipx.

by Script Depot·107 views
$ tokrepo install graphify-repo-knowledge-graph-mcp
Skill#07
Claude Code Agent: Legacy Modernizer

Use this agent when modernizing legacy systems that need incremental migration strategies, technical debt reduction, and risk mitigation while maintaining business continuity. Specifically:\\n\\n<example>\\nContext: A development team has a 15-year-old mono...

by TokRepo精选·23 views
$ tokrepo install claude-code-agent-legacy-modernizer-dccb0175
Skill#08
Claude Code Agent: Technical Debt Manager

Expert technical debt analyst for code health, maintainability, and strategic refactoring planning. Use PROACTIVELY when codebase shows complexity growth, when planning...

by TokRepo精选·25 views
$ tokrepo install claude-code-agent-technical-debt-manager-6285fca6
Skill#09
Claude Code CLAUDE.md — Best Practices Template

Production-tested CLAUDE.md template for Claude Code projects. Covers coding conventions, test requirements, git workflow, and project-specific AI instructions.

by Skill Factory·245 views
$ tokrepo install claude-code-claude-md-best-practices-template-b152c845
Skill#10
Claude Code Agent: Architect Reviewer

Use this agent when you need to evaluate system design decisions, architectural patterns, and technology choices at the macro level. Specifically:\ \ \ Context: Team has...

by TokRepo精选·25 views
$ tokrepo install claude-code-agent-architect-reviewer-a8044a3f
常见问题

常见问题

AI agent 不会瞎编架构吗?

如果你让它直接读原始文件回答,会编。所以前三个 pick(Codebase Memory MCP / Codebase Explorer / Pattern Finder)的存在意义就是:先建一个结构化索引,agent 查索引而不是猜。答案有真实图谱兜底,hallucination 大幅下降。头几个回答自己手工 verify 一下,对得上之后再扩大信任 — 这是合理的递进。

百万行仓库索引到底要多久?

Codebase Memory MCP 和 CodeGraphContext 在中端笔记本上首次跑 30-90 分钟很常见。ast-index 快很多,通常 5 分钟内。第一天挂夜里跑重的那两个,后面查询都是亚秒级。三个都支持 file save 后增量索引,每次改动只额外几毫秒。

入职第一周真能写出有用的 CLAUDE.md 吗?

能 — 前提是把输出当初稿而不是定稿,并且配一次老员工 review。模块摘要 + 债务 triage + 团队黑话清单,是大部分团队从来没系统化过的结构化第一稿。花 30 分钟跟一个老员工标错处,然后发出 CLAUDE.md / AGENTS.md 的 v0.1。每周迭代。一旦团队看到具体的东西可以挑错,他们就会开始贡献。

为什么要 CLAUDE.md 和 AGENTS.md 两份?一份不够吗?

Claude Code 按约定读 CLAUDE.md;通用 agent(Codex / Cursor / OpenCode / 各种 agent SDK)越来越多看的是 AGENTS.md。两份都保留,覆盖未来两年团队可能用的所有 agent。用软链或单源生成两份避免 drift。

我们仓库是私有的,代码不能传云端 LLM,怎么办?

这十个 pick 全都支持本地优先或自部署。Codebase Memory MCP / CodeGraphContext / Graphify / ast-index 全本地跑。Claude Code subagent 和 CLAUDE.md 模板可以接 agent 能对话的任意模型 — 包括本地 Ollama 或 vLLM endpoint。整套 pack 可以做到一个字节代码都不离开你笔记本。

更多主题包

12 个主题包 · 80+ 精选资产

回首页浏览全部精选合集

返回主题包总览