Automatisation du Navigateur
Browser-Use, Skyvern, Stagehand et les extensions Chrome que les agents utilisent vraiment.
Ce que contient ce pack
Ce pack rassemble les sept ressources d'automatisation navigateur qui reviennent encore et encore quand on rétro-ingénière des configurations d'agents sérieuses depuis les repos publics et captures Twitter. Trois sont les frameworks open-source phares. Trois sont des templates de scraping qui les enveloppent. Un est le correctif MCP opérationnel qui empêche Chrome de casser quand plusieurs agents partagent le même navigateur.
| # | Ressource | Type | Ce qu'elle fait |
|---|---|---|---|
| 1 | Browser-Use | Framework Python | Wrapper Playwright LLM-natif |
| 2 | Skyvern | Service Python | Vision + LLM pour navigateur, tourne en server |
| 3 | Stagehand | Framework TypeScript | SDK Browserbase niveau-prod |
| 4 | Patch Chrome MCP | Serveur MCP | Bloque les popups qui bloquent les agents |
| 5 | Template scraper headless | Recette | Skyvern + cron de départ |
| 6 | Scraper derrière login | Recette | OAuth + réutilisation de session |
| 7 | Web reader pour agents | Serveur MCP | Fetch Markdown-friendly pour Claude Code / Cursor |
Pourquoi ce pack existe
La plupart des tutos "AI scraper" s'arrêtent à "ouvre la page et lis le texte". L'automatisation navigateur réelle doit gérer les murs de login, bannières de cookies, popups modaux, scroll infini, et le fait que plusieurs agents essayant de piloter la même session Chrome vont se battre. Ce pack choisit les sept ressources qui résolvent ces problèmes spécifiquement — pas les 200 alternatives très étoilées mais abandonnées.
Les trois frameworks phares ont chacun leur niche :
- Browser-Use est le point d'entrée le plus facile. Python-natif, livré avec un wrapper Playwright auquel un LLM peut parler en anglais simple. Mieux pour automatisations ponctuelles et prototypes.
- Skyvern tourne en server et utilise vision + LLM ensemble. Mieux quand la structure change entre visites et que les sélecteurs cassent. Plus lent que Browser-Use mais plus résistant.
- Stagehand est l'option production. TypeScript-first, fait par l'équipe Browserbase, conçu pour faire tourner des milliers de sessions agent. Pour livrer un produit client, c'est celui-ci.
Le patch popup Chrome MCP est inclus parce que toute configuration multi-agent Chrome finit par tomber sur le bug où le modal d'un agent bloque le clic d'un autre. Le serveur MCP intercepte les patterns de popup courants et les nettoie automatiquement.
Installer en une commande
# Installe le pack entier
tokrepo install pack/browser-automation
# Ou choisissez le framework dont vous avez vraiment besoin
tokrepo install browser-use
tokrepo install skyvern
tokrepo install stagehand
Le TokRepo CLI installe chaque ressource au bon endroit pour votre outil IA — subagents Claude Code dans .claude/agents/, règles Cursor dans .cursor/rules/, AGENTS.md pour Codex CLI, etc. Prenez le sous-ensemble qui correspond à votre stack.
Attention à
- Ne lancez pas Browser-Use et Stagehand sur le même profil Chrome simultanément. Ils se battront pour l'onglet actif. Utilisez des user-data-dirs séparés ou une session Browserbase distante.
- Skyvern a besoin d'un GPU ou d'un fallback modèle vision pas cher. La config par défaut appelle GPT-4o pour chaque écran — ça monte vite sur des scrapes longs.
- Scraping derrière login casse les CGU reCAPTCHA. Restez sur vos propres dashboards ou sites qui autorisent explicitement l'automatisation. Le pack livre un pattern "export session depuis navigateur réel" pour éviter de logger via l'agent.
- Les bannières cookies ne sont pas toutes RGPD. Beaucoup de sites les utilisent comme pièges anti-bot. Le patch popup MCP résout les courants ; le reste vous l'ajouterez à la main.
- La détection headless est réelle. Cloudflare et DataDome vous prendront des empreintes. Pour bypasser, utilisez Stagehand avec Browserbase — ils gèrent la couche stealth.
Quand ce pack ne suffit pas
Si votre objectif est du crawling massif d'un seul site à forte valeur (offres d'emploi, immobilier, e-commerce), un scraper dédié comme Apify ou un cluster Playwright maison rendra 5-10x mieux en coût que l'automatisation agent. L'automatisation navigateur agent brille quand :
- Vous ne savez pas à l'avance quels champs vous voulez
- Le layout varie entre les visites
- Vous voulez coller le scraping dans une tâche agent plus large (research, lead gen, QA)
Pour le pur débit, laissez tomber le LLM et écrivez les sélecteurs vous-même. Pour la flexibilité et la résistance aux changements de layout, ce pack gagne.
7 ressources prêtes à installer
Questions fréquentes
Browser-Use est-il gratuit ?
Oui. Browser-Use est sous licence MIT et vous payez seulement les tokens LLM qu'il consomme (n'importe quel modèle Claude / GPT-4 / poids ouverts marche). La librairie tourne partout où Python et Playwright tournent. Skyvern et Stagehand sont aussi OSS — Stagehand a une option hébergée payante via Browserbase si vous voulez du Chrome managé.
Est-ce que ça marchera dans Codex CLI ou Cursor au lieu de Claude Code ?
Les sept ressources sont tool-agnostiques — ce sont des librairies Python/TypeScript, pas des subagents spécifiques Claude Code. Le TokRepo CLI installe le bon câblage pour votre outil (subagents pour Claude Code, règles pour Cursor, AGENTS.md pour Codex CLI). Browser-Use a même un switch OpenAI/Anthropic intégré pour l'apparier avec le modèle utilisé par votre CLI.
Comment Skyvern se compare-t-il à Browser-Use ?
Skyvern utilise la vision (capture + LLM) pour trouver les éléments, donc il survit aux changements de layout qui cassent les scrapers à sélecteurs. Browser-Use est sélecteur-driven via Playwright, plus rapide et moins cher mais plus fragile. Règle : prototypez avec Browser-Use, livrez avec Skyvern ou Stagehand selon que vous avez besoin de vision (Skyvern) ou de scale (Stagehand).
Quelle est la différence avec le pack MCP Server Stack ?
MCP Server Stack se concentre sur les connecteurs niveau-protocole — serveurs MCP navigateur, base de données, filesystem — que tout agent peut brancher. Browser Automation a une opinion sur quels outils navigateur utiliser et comment scraper avec eux. Le patch Chrome MCP apparaît dans les deux packs parce qu'il est porteur pour tout agent qui touche un vrai navigateur.
Quand ne PAS utiliser l'automatisation navigateur agent ?
Quand le débit compte plus que la flexibilité. Si vous scrapez les mêmes 100 pages produit toutes les heures et que le layout ne change jamais, écrivez les sélecteurs Playwright directement — vous couperez le coût 10x et supprimez une dépendance LLM instable. Utilisez la couche agent quand la tâche est exploratoire ou la page inconnue.
12 packs · 80+ ressources sélectionnées
Découvrez tous les packs curatés sur la page d'accueil
Retour à tous les packs