这个 Skill 能做什么?
这个 Skill,能让你的 Agent 联网能力提升到最离谱的一集。
- 10 个子 Agent 同时操作小红书、微博、B站、Boss、虎嗅等 10 个不同平台
- 一次性打开 100 个网页,并行操作各平台界面,查阅内容、汇总报告
- 不抢用户电脑控制权,Agent 后台自行站内搜索、连续操作网页
- 自动在各大社交平台发布内容:打开社媒平台、填文案、传图片、自动发布,无需人为介入
- 更日常的联网需求:找剧集播放、查询美签预约系统、自动化 Web 测试
- 遇到部分人机验证,也能自动过
- 自动沉淀站点操作经验,Agent 联网操作越用越顺
这些能力,都是 Agent 在这套 Skill 加持后的泛化表现,无需针对任何站点特化调优。
兼容 Claude Code、OpenClaw 等所有支持 skill 的 Agent。
为什么需要这个 Skill?
现有 Agent 联网方案的问题
Claude Code:默认 Web Search 做搜索、Web Fetch 读页面;装 Playwright、Chrome Devtool MCP 后也能控制浏览器。但只提供工具,访问策略全靠模型判断。
模型太容易钻牛角尖了:
- 拿着 Search 工具,换各种关键词在搜索引擎里请求非公开网页的信息
- 用 fetch 无能地请求需要登录、JS 密集的网站(根本加载不出来)
- 需自行安装 Playwright、Agent Browser CLI,还免不了多次踩坑
OpenClaw:提供 CDP 模式,但每个网站需要重新登录,部分网站组件在 CDP 模式下无法加载。
而且,它们对 Agent 并发操作多个网页的支持都不算很好,还可能和你抢浏览器控制权。
理想的 Agent 联网方案
- 灵活分配策略:搜索、静态读取、浏览器策略灵活切换,遇到障碍能自己换工具
- 复用已有登录态:不为每个站点单独维护一套身份
- 强大泛化能力:适应不同联网任务与目标站的操作、反爬要求
- Sub-Agent 分治:高并发跑海量网页,后台执行,互不干扰
- 沉淀操作经验:下次访问同一个站点不用从头试错
安装方法
把下面这段话发给你的 Agent,就能完成安装:
帮我安装 web-access skill,仓库地址是 https://github.com/eze-is/web-access。
这个 skill 原为 Claude Code 设计,安装前请先理解其核心原理和工作逻辑,
再结合你的 Agent 架构与电脑环境进行适配,使其真正融入当前环境,而非生硬移植。Agent 会自动下载、配置环境,完成安装。不需要手动操作。
前置要求
- 【必须】 安装 Chrome 浏览器并更新到最新版本
- Chrome 浏览器地址栏输入
chrome://inspect/#remote-debugging,勾选 Allow remote debugging for this browser instance
使用方式
输入 "遵循 web-access skill" 手动要求 Agent 参考;或直接输入你想做的联网任务:
- 搜索信息、查看网页内容:"帮我查 xx"
- 操作网页界面(填表、点击、上传):"打开 xx"
- 抓取、发布社交平台内容:"帮我在 xx 平台写 xx"
- 读取动态渲染页面、任何需要浏览器的网络任务
建议关闭多余的浏览器 MCP 服务(如 Chrome Devtools、Playwright MCP),避免模型在工具中左右互搏。
Skill 设计哲学
核心理念
激发模型能力上限的 Skill = Agent 策略哲学 + 最小完备工具集 + 必要的事实说明
通用场景的 Agent Skill,需避免过度指定 Agent「该怎么做」。更侧重:
- 重新校准模型在对应场景的策略哲学
- 补充 Agent 缺少的基础工具
- 提前强调模型显然未必记得的事实说明
四步循环
- 定义成功标准:什么算完成了?拿到什么信息、执行什么操作、达到什么结果?
- 选最可能直达的方式作为起点:如已知涉及需要登录态、反爬的平台,直接进浏览器
- 过程校验:每一步的结果都是证据。搜索没命中,不一定是关键词不对,也可能是目标本身不存在。遇到弹窗和登录墙,先判断内容是否已经在 DOM 里
- 对照成功标准确认完成后停止:不过度操作与纠结
工具最小完备集
人类上网其实就三种行为:搜(找到信息在哪)、看(看到内容)、做(在页面上执行操作)。
| 行为 | 工具 | 说明 |
|---|---|---|
| 搜 | Search | 搜索摘要、发现信息来源 |
| 看 | Fetch / curl / 浏览器 | 公开页面 AI 提取,或浏览器打开动态页面 |
| 做 | 浏览器自动化 | 点击、填表、上传等交互操作 |
选择 Chrome 自带 CDP 的原因:原生 WebSocket 交互方式能更好地规避大部分网站的反爬识别,天然支持单个浏览器内多 tab 并行后台操作,直连用户日常 Chrome,天然携带登录态。
Sub-Agent 分治
联网任务经常涉及多个独立目标。利用 Claude Code 等 Agent 框架的 Sub-agent 机制,把独立子任务分配给子 Agent 并行执行,主 Agent 只接收汇总后的结果。
架构上,所有子 Agent 共享同一个 Chrome、同一个 CDP Proxy,各自创建自己的后台 tab,通过不同的 targetId 操作,互不干扰,无竞态风险。
注意:Prompt 用词陷阱
主 Agent 给子 Agent 写 prompt 时,默认会使用干扰子 Agent 行为的用词。比如你写「调研」,主 Agent 可能分配给子 Agent 的 Prompt 变成「搜索」——导致子 Agent 被锚定到 WebSearch,而不是用浏览器进入反爬平台。
经验沉淀机制
每次操作完一个站点,Agent 会自动把该站点的访问策略沉淀下来:平台特征、有效的 URL 模式、已知的陷阱,按域名存储。
效率差异显著(以小红书找博主主页为例,有经验 vs 无经验模式下时间差约 90%)。
经验文件中标注了发现日期,当作「可能有效的提示」而非「保证正确的事实」。网站会改版,反爬策略会更新。如果按经验操作失败,Agent 会自动回退通用模式并更新经验文件。
安装地址
🔗 GitHub: https://github.com/eze-is/web-access
MIT 协议开源,兼容 Claude Code、OpenClaw 等所有支持 skill 的 Agent。