Skills2026年3月31日·3 分钟阅读

一个Skill,拉满Agent联网和浏览器能力

开源 Agent Skill,让 Claude Code / OpenClaw 等 Agent 获得完整联网能力:10个子Agent并行操作100个网页,自带登录态复用、站点经验沉淀、反爬适配。安装一行命令搞定。

TO
TokRepo精选 · Community
快速使用

先拿来用,再决定要不要深挖

这里应该同时让用户和 Agent 知道第一步该复制什么、安装什么、落到哪里。

这个 Skill 能做什么?

这个 Skill,能让你的 Agent 联网能力提升到最离谱的一集。

  • 10 个子 Agent 同时操作小红书、微博、B站、Boss、虎嗅等 10 个不同平台
  • 一次性打开 100 个网页,并行操作各平台界面,查阅内容、汇总报告
  • 不抢用户电脑控制权,Agent 后台自行站内搜索、连续操作网页
  • 自动在各大社交平台发布内容:打开社媒平台、填文案、传图片、自动发布,无需人为介入
  • 更日常的联网需求:找剧集播放、查询美签预约系统、自动化 Web 测试
  • 遇到部分人机验证,也能自动过
  • 自动沉淀站点操作经验,Agent 联网操作越用越顺

这些能力,都是 Agent 在这套 Skill 加持后的泛化表现,无需针对任何站点特化调优。

兼容 Claude Code、OpenClaw 等所有支持 skill 的 Agent。


为什么需要这个 Skill?

现有 Agent 联网方案的问题

Claude Code:默认 Web Search 做搜索、Web Fetch 读页面;装 Playwright、Chrome Devtool MCP 后也能控制浏览器。但只提供工具,访问策略全靠模型判断。

模型太容易钻牛角尖了:

  • 拿着 Search 工具,换各种关键词在搜索引擎里请求非公开网页的信息
  • 用 fetch 无能地请求需要登录、JS 密集的网站(根本加载不出来)
  • 需自行安装 Playwright、Agent Browser CLI,还免不了多次踩坑

OpenClaw:提供 CDP 模式,但每个网站需要重新登录,部分网站组件在 CDP 模式下无法加载。

而且,它们对 Agent 并发操作多个网页的支持都不算很好,还可能和你抢浏览器控制权。

理想的 Agent 联网方案

  1. 灵活分配策略:搜索、静态读取、浏览器策略灵活切换,遇到障碍能自己换工具
  2. 复用已有登录态:不为每个站点单独维护一套身份
  3. 强大泛化能力:适应不同联网任务与目标站的操作、反爬要求
  4. Sub-Agent 分治:高并发跑海量网页,后台执行,互不干扰
  5. 沉淀操作经验:下次访问同一个站点不用从头试错

安装方法

把下面这段话发给你的 Agent,就能完成安装:

帮我安装 web-access skill,仓库地址是 https://github.com/eze-is/web-access。
这个 skill 原为 Claude Code 设计,安装前请先理解其核心原理和工作逻辑,
再结合你的 Agent 架构与电脑环境进行适配,使其真正融入当前环境,而非生硬移植。

Agent 会自动下载、配置环境,完成安装。不需要手动操作。

前置要求

  1. 【必须】 安装 Chrome 浏览器并更新到最新版本
  2. Chrome 浏览器地址栏输入 chrome://inspect/#remote-debugging,勾选 Allow remote debugging for this browser instance

使用方式

输入 "遵循 web-access skill" 手动要求 Agent 参考;或直接输入你想做的联网任务:

  • 搜索信息、查看网页内容:"帮我查 xx"
  • 操作网页界面(填表、点击、上传):"打开 xx"
  • 抓取、发布社交平台内容:"帮我在 xx 平台写 xx"
  • 读取动态渲染页面、任何需要浏览器的网络任务

建议关闭多余的浏览器 MCP 服务(如 Chrome Devtools、Playwright MCP),避免模型在工具中左右互搏。


Skill 设计哲学

核心理念

激发模型能力上限的 Skill = Agent 策略哲学 + 最小完备工具集 + 必要的事实说明

通用场景的 Agent Skill,需避免过度指定 Agent「该怎么做」。更侧重:

  • 重新校准模型在对应场景的策略哲学
  • 补充 Agent 缺少的基础工具
  • 提前强调模型显然未必记得的事实说明

四步循环

  1. 定义成功标准:什么算完成了?拿到什么信息、执行什么操作、达到什么结果?
  2. 选最可能直达的方式作为起点:如已知涉及需要登录态、反爬的平台,直接进浏览器
  3. 过程校验:每一步的结果都是证据。搜索没命中,不一定是关键词不对,也可能是目标本身不存在。遇到弹窗和登录墙,先判断内容是否已经在 DOM 里
  4. 对照成功标准确认完成后停止:不过度操作与纠结

工具最小完备集

人类上网其实就三种行为:(找到信息在哪)、(看到内容)、(在页面上执行操作)。

行为 工具 说明
Search 搜索摘要、发现信息来源
Fetch / curl / 浏览器 公开页面 AI 提取,或浏览器打开动态页面
浏览器自动化 点击、填表、上传等交互操作

选择 Chrome 自带 CDP 的原因:原生 WebSocket 交互方式能更好地规避大部分网站的反爬识别,天然支持单个浏览器内多 tab 并行后台操作,直连用户日常 Chrome,天然携带登录态。


Sub-Agent 分治

联网任务经常涉及多个独立目标。利用 Claude Code 等 Agent 框架的 Sub-agent 机制,把独立子任务分配给子 Agent 并行执行,主 Agent 只接收汇总后的结果。

架构上,所有子 Agent 共享同一个 Chrome、同一个 CDP Proxy,各自创建自己的后台 tab,通过不同的 targetId 操作,互不干扰,无竞态风险。

注意:Prompt 用词陷阱

主 Agent 给子 Agent 写 prompt 时,默认会使用干扰子 Agent 行为的用词。比如你写「调研」,主 Agent 可能分配给子 Agent 的 Prompt 变成「搜索」——导致子 Agent 被锚定到 WebSearch,而不是用浏览器进入反爬平台。


经验沉淀机制

每次操作完一个站点,Agent 会自动把该站点的访问策略沉淀下来:平台特征、有效的 URL 模式、已知的陷阱,按域名存储。

效率差异显著(以小红书找博主主页为例,有经验 vs 无经验模式下时间差约 90%)。

经验文件中标注了发现日期,当作「可能有效的提示」而非「保证正确的事实」。网站会改版,反爬策略会更新。如果按经验操作失败,Agent 会自动回退通用模式并更新经验文件。


安装地址

🔗 GitHub: https://github.com/eze-is/web-access

MIT 协议开源,兼容 Claude Code、OpenClaw 等所有支持 skill 的 Agent。

相关资产