TOKREPO · 主题包

稳定

浏览器 Agent + 网页自动化全家桶

想做一个能替用户上网干活的 agent，这十个就是顺序：browser-use Python skill + Playwright MCP for agents + Browserbase 云端无头 + Obscura 隐身无头 + Pydoll 不用 WebDriver + Scrapling 自适应爬虫 + Firecrawl markdown API + Jina Reader URL→LLM 文本 + Mem0 记忆层 + Apify MCP 调度 8000+ 现成爬虫。端到端 agent 工作流，不只是框架对比。

10 个资产

关于这个主题包

这个 pack 包含什么

这不是「玩一下午 Browser-Use」用的，是想真把一个替用户上网干活的 agent 推上生产、面对会反爬的网站用的一套组合。TokRepo 上原本的 Browser Automation pack 是框架对比 — 三个 SDK 横评。这个 pack 是下一层：框架 + 无头运行时 + 反爬对抗 + 内容抽取 + 记忆 + 调度，按安装顺序串好。

每个 pick 都负责流水线的一个环节。合起来回答真问题：浏览器在哪跑、怎么不被指纹识别、agent 喂给 LLM 的是什么、跨会话怎么记住事、从一个标签页扩到一万个怎么不用自己写队列。

目标用户是做调研 / 拉名单 / 填表 / 下单 / 监控类 agent 的开发者 — 任何需要 LLM 操作真浏览器、应付登录墙和 Cloudflare、并且跨周累积上下文的场景。

它们怎么协同（ASCII 流水线）

         ┌── 用户请求 ──┐
         │ "帮我订一张..." │
         └──────┬─────────┘
                ▼
   ┌─── agent loop ──────────────────────────────┐
   │  browser-use skill / Playwright MCP        │
   │  （LLM ↔ 浏览器 ↔ DOM 动作循环）            │
   └────────────────┬───────────────────────────┘
                    ▼
   ┌─── 无头运行时 ──────────────────────────────┐
   │  Browserbase（云端、托管隐身）              │
   │      或                                     │
   │  Obscura（自托管、数据本地）                │
   └────────────────┬───────────────────────────┘
                    ▼
   ┌─── 反爬层 ─────────────────────────────────┐
   │  Pydoll（不要 WebDriver 标志 → 干掉简单的  │
   │           Cloudflare / DataDome 过滤）      │
   │  Scrapling（自适应选择器 → 扛得住改版）    │
   └────────────────┬───────────────────────────┘
                    ▼
   ┌─── 内容抽取 ────────────────────────────────┐
   │  Firecrawl（URL → 干净 markdown）          │
   │  Jina Reader（免费兜底）                   │
   │  → LLM 友好文本 + 结构化数据               │
   └────────────────┬───────────────────────────┘
                    ▼
   ┌─── 记忆 ────────────────────────────────────┐
   │  Mem0（跨会话事实、坏选择器、用户偏好）    │
   └────────────────┬───────────────────────────┘
                    ▼
   ┌─── 调度 ────────────────────────────────────┐
   │  Apify MCP（8000+ 现成爬虫，不想为每个     │
   │            站自己造轮子时直接用）           │
   └─────────────────────────────────────────────┘

流水线故意留两个入口：agent 可以自己开浏览器（browser-use + Playwright MCP），也可以委派给 Apify MCP 调一个已经写好的爬虫。真正在生产跑的 agent 两条路都走 — 长尾站偶尔访问就自己开 Chrome，常打的 50 个站直接调 Apify Actor。

你会遇到的取舍

browser-use vs Playwright MCP — browser-use 是你 import 的 Python 框架；Playwright MCP 是你 agent 通过 JSON-RPC 调的 server。Agent 运行时是你自己控制（你写的 Python 服务）就 import 框架。Agent 是第三方工具（Claude Code / Cursor）改不了源码就用 MCP。
Browserbase vs Obscura — Browserbase 是无头浏览器界的 AWS：零运维、按分钟计费、隐身全帮你搞定。Obscura 是自托管：机器买了之后单会话成本为 0，但你要运维。按月浏览器小时数选：< ~200 小时 / 月 Browserbase 总拥有成本赢，更高 Obscura 开始划算。
Pydoll vs Playwright — Playwright 是行业标准，但每家检测厂商都识别它的指纹。Pydoll 直接接 CDP，通用过滤器不好一刀切。代价：Pydoll API 还年轻，没那么好用。不会反扑的站用 Playwright（或 Playwright MCP），被拦截的那部分流量切到 Pydoll。
Scrapling vs 手写选择器 — 手写 CSS/XPath 写得快但易碎。Scrapling 每次查询多花几毫秒算相似度，但选择器扛得住下次部署。一次性爬手写；跑超过一周一次的活用 Scrapling。
Firecrawl vs Jina Reader — Firecrawl 收费、批量友好、能渲染 JS。Jina Reader 免费、单 URL、活页面慢时给你缓存快照。原型期先用 Jina，被限流或覆盖不够再切 Firecrawl。
Mem0 vs 把上下文塞 prompt — 你可以把所有历史塞进 system prompt 然后每轮都为它付 token。Mem0 只检索相关事实（上次坏的选择器、用户偏好的日期格式），每轮约 200 token 而不是 20000。
Apify MCP vs 自己写 — Apify 的 8000+ Actor 是专门盯一个站的人维护的。Twitter/X、LinkedIn、Amazon、Google Maps 这种，Apify 在稳定性和「下一波反爬升级后仍能用」上完胜。目标是长尾站、或者数据需求太定制装不进任何现成 Actor 时再自己造。

常见踩坑

Browser-Use 和 Playwright MCP 跑同一个 Chrome profile。两个 agent 共用同一个 user-data-dir 会抢活跃 tab、把 session 状态搞乱。永远用不同的 profile 目录，或者把其中一个迁到 Browserbase / Obscura 会话上。
忘了 navigator.webdriver 这个标志。标准 Playwright 默认把它设为 true。这个布尔值是任何商业 bot 检测器读的第一个东西。要么通过 CDP 改掉、要么用 Pydoll、要么接受任何挂 Cloudflare 的站迟早 403 你。
把 Apify Actor 当本地代码用。Apify Actor 在云端跑、按计算单元收费。Agent 在循环里调它没限速账单就上门了。用 Mem0 存一个每日预算，每次调用前 agent 自己检查。
把凭证存在 agent prompt 或 Mem0 明文里。用宿主 CLI 的 secret 管理（Claude Code 的 ~/.claude/secrets、服务的环境变量），让 agent 按名字读、不读值。Mem0 只记「有这个凭证」，永不记内容。
递归抓得太狠。调研 agent 递归点击每页所有链接，一下午把 Firecrawl 配额烧光。深度卡 2、按 URL hash 去重、用 Mem0 跳过上周已访问的 URL。
跳过内容抽取直接喂 HTML 给 LLM。又贵又脏。永远过 Firecrawl 或 Jina Reader，LLM 看到的是 markdown 不是导航菜单和跟踪脚本。

安装 · 一行命令

$ tokrepo install pack/browser-agent-web-automation

丢给 agent，或粘到终端

包内含什么

10 个资产打包就绪

Skill#01

browser-use — Python Browser Agent Toolkit

browser-use runs a Python agent that controls a real browser for web tasks. Use the repo’s uv quickstart, then run an Agent with your LLM provider.

by Script Depot·177 views

$ tokrepo install browser-use-python-browser-agent-toolkit

MCP#02

Playwright MCP — Browser Automation for Agents

Playwright MCP exposes browser automation via MCP with device emulation; verified 5,510★ and documents 143 device profiles plus `playwright install` setup.

by MCP Hub·281 views

$ tokrepo install playwright-mcp-browser-automation-for-agents

Agent#03

Browserbase — Cloud Browser Infra for AI Agents

Browserbase runs managed cloud Chromium for AI agents. Stagehand, Playwright, Puppeteer compatible. Scales to 1000s of parallel sessions with replay.

by Browserbase·208 views

$ tokrepo install browserbase-cloud-browser-infra-for-ai-agents

Skill#04

Obscura — Headless Browser Built for AI Agents and Web Scraping

A high-performance headless browser written in Rust, designed specifically for AI agent workflows and large-scale web scraping with built-in stealth and anti-detection capabilities.

by Script Depot·414 views

$ tokrepo install obscura-headless-browser-built-ai-agents-web-scraping-f6865bc8

Script#05

Pydoll — Browser Automation Without WebDriver

Python async browser automation via Chrome DevTools Protocol. Built-in CAPTCHA solving, anti-detection, no Selenium needed. 6.7K+ stars.

by Script Depot·361 views

$ tokrepo install pydoll-browser-automation-without-webdriver-708bb34d

Skill#06

Scrapling — Adaptive Web Scraping Framework for Python

An intelligent Python web scraping framework that handles single requests to full-scale crawls with built-in anti-detection and auto-adaptation.

by Script Depot·208 views

$ tokrepo install scrapling-adaptive-web-scraping-framework-python-cc74e4fa

Skill#07

Firecrawl — Web Scraping API for AI Applications

Turn any website into clean markdown or structured data for LLMs. Firecrawl handles JavaScript rendering, anti-bot bypassing, sitemaps, and batch crawling via simple API.

by Firecrawl·334 views

$ tokrepo install firecrawl-web-scraping-api-ai-applications-6a62a986

Skill#08

Jina Reader — Convert Any URL to LLM-Ready Text

Convert any URL to clean, LLM-friendly markdown with a simple prefix. Just prepend r.jina.ai/ to any URL. Handles JS-rendered pages, PDFs, and images. 10K+ stars.

by Script Depot·7368 views

$ tokrepo install jina-reader-convert-any-url-llm-ready-text-a9cbbc61

Skill#09

Mem0 — Memory Layer for AI Applications

Add persistent, personalized memory to AI agents and assistants. Mem0 stores user preferences, past interactions, and learned context across sessions.

by Mem0·1014 views

$ tokrepo install mem0-memory-layer-ai-applications-96da1f40

MCP#10

Apify MCP Server — 8,000+ Web Scrapers for Agents

Apify MCP Server connects agents to Apify Actors via a hosted endpoint (mcp.apify.com) or local run, turning thousands of web scrapers into callable tools.

by MCP Hub·289 views

$ tokrepo install apify-mcp-server-8-000-web-scrapers-for-agents

常见问题

十个工具我都要装吗？能不能先小一点起步？

先装三个：browser-use skill 跑 agent 循环、Playwright MCP 让现有 MCP 客户端能驱动它、Jina Reader 处理内容侧。这是一个晚上就能在笔记本上跑通的网页 agent。再装 Browserbase 或 Obscura 当你超过单机 Chrome 容量。第一次被 Cloudflare 403 时加 Pydoll。第一次半夜选择器坏掉时加 Scrapling。Jina 被限流或需要批量 markdown 时加 Firecrawl。发现自己每个 prompt 都复制粘贴一样的上下文时加 Mem0。Agent 反复撞到一些已有现成爬虫的站时加 Apify MCP。全 10 件套要等 agent 跨周无人值守、对接 ~20 个以上不同站点之后才真划得来。

这个 pack 和 TokRepo 上已有的 Browser Automation pack 有啥区别？

Browser Automation pack 是框架对比 — Browser-Use vs Skyvern vs Stagehand 横评，加一个 Chrome MCP 弹窗补丁。它回答「import 哪个库」。这个 pack 回答下一个问题：要真把 agent 发出去，那个库周围还需要什么 — 无头运行时、反爬对抗、内容抽取、持久记忆、和把活外包给已有爬虫的路。两个 pack 资产零重叠，互补不重复。

Agent 驱动的爬虫会不会让我被告？

完全看目标站和法域。爬公开数据在 hiQ v. LinkedIn 之后在美国一般受保护，但绕过反爬措施、爬登录墙后内容、违反站点 TOS 都开真实责任窗口。安全模式：爬自己的 dashboard、爬 TOS 明确允许自动化的站（多数搜索引擎、多数公开数据门户）、或对那些 Actor 作者已经做过法律分析的站用 Apify Actor。永远不要把反爬层（Pydoll、Browserbase 隐身）用在你没读过 TOS 的站上。

为啥一个浏览器 pack 里放记忆层（Mem0）？

因为有用的浏览器 agent 不是无状态的。跨会话它要记：上周哪个选择器坏了换成了啥替代、哪些站限流过、上次什么时候可以重试、哪些登录流程要 2FA 需要用户确认、用户的收货地址是啥、「我常订的航班」指啥。这些每轮全塞 system prompt 既浪费 token 又扛不住规模化。Mem0 每轮只检索相关事实 — 一般几百 token — 其余存向量库。没有记忆层，每个 agent 每周都要重新发现一遍同样的坏选择器。

同一套 pack 能在 Claude Code / Cursor / Codex CLI 都跑吗？

能。十个 pick 里有六个是 MCP server 或 Python/TypeScript 库，任何 agent 宿主都能调。Playwright MCP、Firecrawl MCP（同一个上游服务）、Apify MCP、Mem0 SDK 都说标准协议。browser-use skill 是 Claude Code skill 格式但底层库是纯 Python — Cursor 和 Codex 通过 AGENTS.md 或 Python tool 定义直接接。Browserbase 和 Obscura 走 HTTP，agent 宿主无关紧要。Pydoll 和 Scrapling 是 Python 库，你 agent 已有的 runtime 里 import 即可。

更多主题包

12 个主题包 · 80+ 精选资产

回首页浏览全部精选合集

返回主题包总览