Gemini CLI 扩展入门套装
刚装好 Gemini CLI、想把 Gemini 多模态 + Google 生态吃透的开发者,这十个就是顺序:CLI 本体 + 被冷落的 5 个官方扩展(BigQuery / Genkit / Firebase / Flutter / gcloud)+ 4 个 MCP(Stitch 设计 / Workspace / NotebookLM / Cloud Assist)。
这个 pack 包含什么
Gemini CLI 转正后,官方扩展长到 10 个左右,大部分教程翻来覆去讲那 4 个(Stitch、Workspace、Code Review、Postgres)。当 demo 演示行,真要在 Google 生态里日常干活——不够用。
这个 pack 写给那种特意选 Gemini CLI 的开发者:因为它有 100 万 token 上下文、Gemini 用户 60 req/min 免费额度、原生多模态输入(截图 / PDF / 视频帧直接喂)、还有 Google 生态深度集成(BigQuery / Firebase / GCP 全是一等公民,不像 Claude Code / Cursor 要靠第三方 MCP 硬接)。你要的是押注这些长项的清单,不是把 Gemini CLI 当 Claude Code 翻版用。
十个:CLI 本体 + 五个被冷落的官方扩展(BigQuery / gcloud / Genkit / Firebase / Flutter 加上 Cloud Assist)+ 四个高杠杆 MCP(把 Gemini 的视觉能力和 Google 应用接入打通)。装到第 10 个,你就有一个能:对着真实 BigQuery 写 SQL、部署 Firebase 函数、用 Stitch 设计 Flutter 界面、读 Gmail + Drive、查 NotebookLM 语料库的 agent。没有一项是表演式集成,全是 Google 原生。
推荐安装顺序
- Gemini CLI — 先装 agent 本体。
npm i -g @google/gemini-cli,Google 账号登录,Gemini API 用户免费 60 req/min + 100 万 token 上下文。别跳过额度检查:免费额度才是这个 stack 对个人开发者可行的根本原因。 - Gemini CLI Extension: gcloud — 地基。gcloud 一旦绑定到自然语言命令,后续所有碰 GCP 的扩展(BigQuery / Firebase / Cloud Assist)都能继承健全的鉴权和项目作用域。先装 gcloud;后面一切都依赖
gcloud auth login健康。 - Gemini CLI Extension: BigQuery — 数据分析杀手锏。Gemini 100 万 token 上下文意味着你可以把 500 张表的 schema 全 paste 进去,问「Q4 营收为啥掉了」,得到一份真能跑的 SQL 草稿。这是 Claude Code 不装第三方 MCP + 折腾 4 小时根本做不到的场景。
- Gemini CLI Extension: Firebase — 部署函数、管理 Firestore 规则、配 auth — 全在 chat 里搞定。如果你做移动 / Web 应用,后端在 Firebase 上,这把
firebase deploy工作流压缩到一个 prompt。 - Gemini CLI Extension: Flutter — 和 Firebase (#4) 配对就是经典 Google 移动栈。Widget 生成、状态管理脚手架、平台专属代码。多模态点:paste 一张你想要的 UI 截图,得到完整的 widget tree。
- Gemini CLI Extension: Genkit — AI 应用框架。当你不再「用 Gemini」开始「嵌入 Gemini」(RAG 流、结构化输出、retriever),Genkit 就是那个 SDK。扩展让 flow 脚手架变成 30 秒的事。
- Gemini Cloud Assist MCP — Google Cloud 私测版 MCP 服务器,把 Cloud Ops API(日志、追踪、IAM 诊断)暴露给任何 MCP 客户端。和 gcloud (#2) 配对:一个对 GCP 说话,这个关于 GCP 说话——生产环境 502 排障时,让 Gemini 直接读 Cloud Logging 流。
- Google Stitch MCP — 多模态实力展柜。Paste 一个 Figma URL、一张旧截图、一张手绘线框图 — Stitch 生成可用的 UI。走 MCP 接线后 Gemini 能迭代(「把 CTA 改蓝、加搜索栏」),设计系统保持一致。这才是 Gemini 视觉 token 该挣的钱。
- Google Workspace MCP — Google 官方 CLI 内置 MCP 服务器,覆盖 Gmail / Drive / Calendar / Docs / Sheets 和 10+ 个 Google 服务。装好后,Gemini 能读你的邮箱、起草回复、占日历、就地改 Docs。把 CLI 从「编码工具」拉到「私人助理」的那一层枯燥但高频的生产力补丁。
- NotebookLM MCP —
nlmCLI 加 MCP server,让 Gemini 操作 NotebookLM notebook:上传源文件、生成音频概览、对私有 RAG 语料库提问。和 Workspace MCP 配对,你就有完整的「读完我所有的东西然后推理」闭环 — 这才是 Gemini 长上下文真正被设计出来的用例。
它们怎么协同
Gemini CLI (#1)
│
└─ 100 万 token · 多模态 · 免费 60 rpm
│
gcloud 扩展 (#2) ←─ 地基:auth + 项目作用域
│
├─ BigQuery (#3) ────────── 数据 + SQL
├─ Firebase (#4) ─┐
│ ├─ 移动 / Web 应用栈
├─ Flutter (#5) ──┘ (截图 → widget 树)
│
└─ Genkit (#6) ─────────── 自己造 AI 功能
Google 生态 MCP(外挂,不是扩展):
├─ Cloud Assist MCP (#7) ── 排障 GCP 生产(日志 / 追踪)
├─ Stitch MCP (#8) ─────── 多模态设计(图 → UI)
├─ Workspace MCP (#9) ───── Gmail / Drive / 日历 / Docs
└─ NotebookLM MCP (#10) ── 长上下文 RAG 对接自己的源
承重三件套:CLI (#1) + gcloud (#2) + 一个匹配你工作流的 MCP。数据人 → Cloud Assist (#7)。设计 / PM → Stitch (#8)。运维杂工 → Workspace (#9)。别第一天就装四个 MCP — 挑当下做的事最匹配那个,撞到缺口再加下一个。
你会遇到的取舍
- Gemini CLI vs Claude Code vs Cursor — 押注不同。Claude Code 是最强的 agent(多步推理 / sub-agent / hooks 最好)。Cursor 是最强的编辑器(IDE 内 diff UI / tab-complete 最丝滑)。Gemini CLI 是最强的 Google 原生多模态工具(100 万 token / 免费额度 / BigQuery / Firebase / Stitch 一等公民)。大部分老手两个都跑:日常 Claude Code 或 Cursor,遇到要 dump PDF / 截图就切 Gemini CLI。
- 官方扩展 vs MCP — 扩展(#2-#6)是第一方、签名分发、零配置。MCP(#7-#10)能力更强但要配 JSON 有时还得另搞 OAuth。有扩展就用扩展;扩展覆盖不了再上 MCP。
- Stitch MCP vs Stitch 扩展 — 官方 Stitch 扩展在 CLI 里用够用了。MCP 版本是同一能力暴露在 MCP 上,让 Cursor 和 Claude Code 也能调。看你日常编辑器说哪种语言;两个编辑器混用就两个都装。
- Workspace MCP vs 直接调 Gmail API — Workspace MCP 一份配置就能让 AI 读邮箱。裸 Gmail API 两小时 OAuth 脚手架才能干同样的事。如果你曾经为了转发邮件写过 Google Apps Script,MCP 这条路严格更优。
- 免费额度的现实检查 — 60 rpm 听着很大方,但多模态调用(图 / 视频帧)烧得更快。如果你天天 paste 截图,第二周之前就该考虑付费 Gemini API key。
常见踩坑
- 「我不用 GCP」就跳过 gcloud (#2) — 就算生产在 AWS,gcloud 扩展是把
gcloud auth接到 BigQuery / Firebase / Cloud Assist 三件套的桥。装上;只 GCP 的命令视而不见就行。 - 每个扩展都装 — 官方扩展约 10 个。不需要全装。挑碰你 stack 的几个。多余扩展会撑大 Gemini 路由请求时要扫的 prompt context,整体会变慢一点。
- 在免费额度上 paste 500 页 PDF — Gemini 会接受、会解析,然后你看着当日额度一次调用烧光。先分块,或者升级到付费。
- Workspace MCP 接错 Google 账号 — 公司数据在
@company.com,OAuth 时一不小心点了个人账号很常见。double-check 授权页。 - 把 Stitch MCP 输出当成能直接上线的成品 — 那是非常好的初稿。push 到生产前先给设计师过一眼。审美是「能用的默认」,不是「贴你品牌的」。
和另一个 Gemini pack 怎么互补
TokRepo 已经有一个 Gemini CLI 官方扩展 pack,覆盖 Google 官方为 Gemini CLI 配的 10 个扩展(Stitch / Workspace / Code Review / Postgres / Vertex AI 等)。那是个全收索引——一次装全,看哪个粘住。
这个 pack 是反向 curation:一份小而有主观判断的多模态优先短清单,混了 CLI 本体、五个被冷落的官方扩展、外加四个把 Gemini 延伸到 Google Workspace / NotebookLM / Stitch / Cloud Ops 的 MCP。如果说官方那份是规格说明书,这份是上手剧本。
10 个资产打包就绪
常见问题
和已有的 Gemini CLI 扩展 pack 有什么不同?
已有那个 pack 是 Google 官方为 Gemini CLI 配的 10 个扩展的全收索引 — Stitch / Workspace / Code Review / Postgres / Vertex AI 等。这个 pack 选法不同:从 CLI 本体开始,挑五个被官方教程冷落的扩展(BigQuery / gcloud / Genkit / Firebase / Flutter),再加四个 MCP(Cloud Assist / Stitch MCP / Workspace MCP / NotebookLM MCP)押在 Gemini 多模态视觉 token 和 Google 应用集成上。角度不同,workflow_ids 大部分不同,故意互补。
Gemini CLI 真的值得和 Claude Code / Cursor 同时装吗?
如果你工作流里有多模态输入 — 值得。Gemini 100 万 token 上下文 + 原生 image / PDF / 视频帧吃进去,Claude Code 和 Cursor 只能装样子。具体例子:paste 200 页合同问条款差异、丢一张 Figma 截图进 chat 拿 Flutter widget 代码、dump 一堆竞品截图拿对比表。免费 60 rpm 让它作为「第二工具」常驻几乎没成本。大多数工程师不替换主力,把 Gemini CLI 当成多模态的「后兜」选项。
需要付费 Google Cloud 账号才能用这些吗?
CLI 加大部分扩展,不需要 — Google 账号就够用,Gemini API 免费档 60 req/min。BigQuery / Firebase / Cloud Assist 这几个扩展会碰你真实的 GCP 资源,所以需要 GCP 项目。两边都有永久免费档(BigQuery:10 GB 存储 + 1 TB/月 查询;Firebase:Spark 方案),无信用卡也能玩。Workspace MCP 任何 Google 账号都行,个人 / 付费都可以。NotebookLM 免费。
为啥要装 Cloud Assist MCP,直接用 gcloud 不就行了?
面对的不是一回事。gcloud 扩展(#2)是发命令(「部署这个」「开那个 bucket」)。Cloud Assist MCP 是对 Cloud 的运维 API 做推理 — Cloud Logging 流、追踪、IAM 诊断、推荐动作。当 Cloud Run 服务在生产抛 502,gcloud 帮你重部署;Cloud Assist 帮你查清为啥。两个都装;互补。
在 Windows 上能用吗?
能,有几个小坑。Gemini CLI 本身走 npm 分发,跨平台没问题。Google Workspace MCP 和 NotebookLM MCP 都是 Node 项目,Windows 原生或 WSL2 都行。Firebase 和 Flutter 扩展需要本地装对应 SDK(firebase-tools 和 flutter SDK) — 都有 Windows 安装器,但 WSL2 更友好。gcloud 有 Windows 原生安装器。唯一摩擦点是长 prompt 在 PowerShell vs bash 下的 shell 引号转义;大多数人为这一条就默认走 WSL2 了。