什么是 Browser Use?
Browser Use 是 Python 库,让 AI 代理控制网页浏览器。使用视觉检测理解页面布局,支持多标签页浏览,兼容任何 LLM。
一句话总结:Browser Use 是 AI 代理浏览器自动化库,支持视觉元素检测、多标签页和自然语言任务执行,5 万+ GitHub stars。
适合人群:需要网页浏览能力的 AI 代理开发者。支持模型:Claude、GPT-4o、Gemini。
核心功能
1. 视觉交互
截图页面,识别可交互元素,自主操作。
2. 多标签页
同时打开多个标签页并行工作。
3. 自定义动作
注册自定义函数,代理自动调用。
4. MCP 服务器模式
作为 MCP Server 接入 Claude Code 等工具。
常见问题
Q: 和 Playwright MCP 比较? A: Playwright MCP 是低级浏览器控制,Browser Use 增加了 AI 视觉和自主任务执行。
Q: 支持 Claude Code 吗? A: 支持,通过 MCP 服务器模式。
来源与致谢
browser-use/browser-use — 50k+ stars, MIT