AI

API de navigateur de Bright Data vs navigateur agent de Vercel : pourquoi l’infrastructure est importante pour les agents IA

Découvrez en quoi Bright Data Browser API et Vercel Agent Browser diffèrent en termes d’infrastructure, de capacités anti-bot et quand les utiliser pour les agents IA.
13 min de lecture
Bright Data's Browser API vs Vercel Agent Browser blog image

Dans cet article, vous apprendrez :

  • Ce que sont l’API Bright Data Browser et Vercel Agent Browser, et en quoi ils diffèrent sur le plan architectural
  • Pourquoi l’infrastructure joue un rôle essentiel dans les performances des navigateurs agents
  • Comment chaque solution gère les systèmes anti-bot, les CAPTCHA et le blocage d’IP
  • Les principales différences en matière d’évolutivité, de tarification et d’intégration de l’IA
  • Quand utiliser chaque outil en fonction de votre cas d’utilisation spécifique

C’est parti !

API de navigateur Bright Data

BrowserAPI-landing-page

L’API Browser de Bright Data (également appelée Agent Browser) est une solution de navigateur hébergée dans le cloud et reposant sur une infrastructure Proxy de niveau entreprise. Elle exécute de véritables navigateurs Chromium GUI sur les serveurs gérés par Bright Data, accessibles via le protocole standard Chrome DevTools Protocol (CDP).

Cela peut sembler compliqué, mais en substance, le Navigateur de scraping de Bright Data vous offre :

  • Plus de 150 millions d’adresses IP rotatives sur des réseaux résidentiels, de centres de données, mobiles et ISP dans 195 pays. J’ai ciblé la géolocalisation au niveau des villes pour des tests de comparaison de prix sans configurer manuellement un seul Proxy.
  • La résolution automatique de CAPTCHA qui gère reCAPTCHA v2/v3, hCaptcha, Cloudflare Turnstile, DataDome, PerimeterX, AWS WAF et GeeTest. En trois mois de tests, je n’ai pas écrit une seule ligne de code pour gérer les CAPTCHA.
  • Gestion complète des empreintes digitales couvrant le canvas, WebGL, le contexte audio, les polices et l’énumération des appareils. Les erreurs « automatisation détectée » que je rencontrais sans cesse avec Playwright vanilla ont complètement disparu.
  • Rotation des empreintes TLS correspondant aux signatures réelles des navigateurs. Cela a résolu des blocages que je ne pouvais même pas diagnostiquer auparavant, où les requêtes échouaient au niveau du réseau avant d’atteindre la page.

La configuration prend cinq minutes. Je remplace ma connexion de navigateur locale par le point de terminaison WebSocket de Bright Data, et tout le reste reste inchangé. Mon code Puppeteer, Playwright ou Selenium fonctionne sans modification.

Pour les CAPTCHA, je peux soit laisser le système les résoudre automatiquement (mon réglage par défaut), soit écouter les événements de détection lorsque j’ai besoin d’un contrôle explicite. La plupart du temps, je ne remarque même pas les CAPTCHA, car ils sont résolus côté serveur avant que mon script ne continue.

Navigateur Vercel Agent

agent-browser-github-page

Vercel a créé Agent Browser pour résoudre un problème spécifique auquel la plupart des développeurs étaient confrontés : l’encombrement de la fenêtre de contexte lorsque les agents IA traitent l’état du navigateur.

Playwright standard renvoie des arbres d’accessibilité complets avec des milliers de nœuds. Lorsque j’utilisais l’automatisation du navigateur via Claude, un seul instantané de page consommait plus de 15 000 jetons. Les workflows complexes épuisaient ma fenêtre contextuelle avant de terminer la tâche.

Le système de capture d’écran + références d’Agent Browser compresse cette même page à environ 1 400 jetons. Au lieu d’obtenir un code HTML verbeux avec des classes, des identifiants, des étiquettes ARIA et des structures imbriquées, j’obtiens :

- bouton « Se connecter » [ref=e1]
- zone de texte « E-mail » [ref=e2]
- zone de texte « Mot de passe » [ref=e3]

Je demande ensuite à l’agent de cliquer sur @e1 ou de remplir @e2. Cette réduction de 93 % signifie 5 à 6 fois plus d’interactions avec le navigateur avant d’atteindre les limites de jetons. Dans un benchmark indépendant, six tests de navigateur ont consommé environ 31 000 caractères (~7 800 jetons) avec Playwright MCP contre seulement ~5 500 caractères (~1 400 jetons) avec Agent Browser, ce qui permet 5,7 fois plus de cycles de test dans le même budget contextuel.

L’outil est une CLI Rust encapsulant Playwright. Il démarre en moins de 50 ms, prend en charge plus de 108 commandes couvrant tout, de la navigation de base à l’enregistrement vidéo, et s’intègre directement à Claude Code, Cursor et d’autres agents IA exécutant des CLI. Pour mes workflows de développement où j’itère sur du code généré, l’efficacité du contexte est vraiment importante.

Le principal compromis : aucune infrastructure. Agent Browser fonctionne localement en utilisant mon IP, expose navigator.webdriver et ne dispose d’aucune fonctionnalité de Résolution de CAPTCHA ou de gestion des empreintes digitales. Pour les sites protégés, je dois faire appel à des fournisseurs externes via le drapeau -p, ce qui ajoute un coût et une complexité qui annulent l’avantage de la « légèreté ».

Test du scraping de Bright Data

Comme il s’agit d’un article comparatif, j’ai effectué quelques tests avec les deux outils.

Premier test : sites protégés par Cloudflare

J’ai pointé les deux outils vers un site de commerce électronique protégé par Cloudflare. Tâche simple : extraire les prix des produits.

Vercel Agent Browser : a fonctionné la première fois, mais a généralement échoué lors de multiples itérations. Agent Browser ne fonctionne pas de manière fiable avec les sites protégés par Cloudflare. Les taux de réussite dépendent du niveau de protection :

Paramètre Cloudflare Agent Browser fonctionnera-t-il ?
Non Cloudflare Oui
Basique (sécurité faible) Peut-être
Mode Bot Fight Non
CAPTCHA tourniquet Non

API Bright Data Browser : chargement de la page en 3 secondes. Pas de CAPTCHA, pas de défi. La rotation des IPs résidentielles et la gestion des empreintes digitales ont tout géré automatiquement. Cette différence de 3 secondes représente le principal écart d’infrastructure que j’ai constaté tout au long des tests.

Paramètres Cloudflare Bright Data fonctionnera-t-il ?
Non Cloudflare Oui
Basique (faible sécurité) Oui
Mode Bot Fight Oui
CAPTCHA tourniquet Oui

La différence ici est simple : l’infrastructure Proxy de Bright Data résout les problèmes liés à la lutte contre les bots au niveau du réseau, tandis qu’Agent Browser n’a jamais été conçu pour y remédier.

Cela correspond aux benchmarks indépendants : Bright Data a atteint un taux de réussite moyen de 98,44 % sur sept domaines difficiles lors des tests de Proxyway, le plus élevé parmi tous les fournisseurs testés. Sur des cibles spécifiques telles que Indeed, Zillow, Capterra et Google, il a atteint un taux de réussite de 100 %, avec 98 % sur Amazon et 97 % sur Google Shopping.

Deuxième test : efficacité des jetons sur les sites coopératifs

Pour que la comparaison soit équitable, j’ai également testé les domaines dans lesquels Agent Browser présente un avantage : les sites coopératifs non protégés. Sur un site de documentation standard sans protection contre les robots, le système de capture instantanée d’Agent Browser a compressé les pages à environ 10 % de ce que produisait l’arborescence d’accessibilité brute de Playwright.

Concrètement, une page type qui consommerait 7 000 à 8 000 jetons avec Playwright standard ne consommait que quelques centaines de jetons avec le système de référence d’Agent Browser. Sur un workflow en plusieurs étapes (navigation dans les documents, extraction d’exemples de code, vérification des résultats), cela signifiait que je pouvais terminer toute la session dans une seule fenêtre de contexte, en effectuant 5 à 6 fois plus d’interactions avant d’atteindre les limites.

Avec l’API Browser de Bright Data, j’ai obtenu les mêmes données, mais la sortie brute de la page a consommé beaucoup plus de jetons. Bright Data n’a pas été conçu pour optimiser les fenêtres de contexte LLM, et cela s’est vu ici. Si votre goulot d’étranglement est le budget en jetons plutôt que l’accès au site, Agent Browser est le meilleur outil.

Troisième test : intégration de l’IA

Les deux outils s’intègrent aux piles d’IA modernes, mais de manière différente.

Bright Data se connecte directement à browser-use, LangChain et LlamaIndex. Voici ma configuration standard :

from browser_use import Agent
from browser_use.browser.browser import Browser, BrowserConfig
from langchain_openai import ChatOpenAI

browser = Browser(
    config=BrowserConfig(
        cdp_url="wss://brd-customer-XXX-Zone-YYY:[email protected]:9222"
    )
)

agent = Agent(
    task="Extract all product prices from the homepage",
    llm=ChatOpenAI(model="gpt-4o"),
    browser=browser
)

Vercel Agent Browser fonctionne via l’exécution CLI. Idéal pour Claude Code et Cursor où l’IA exécute directement des commandes bash :

npx skills add vercel-labs/agent-browser

Claude peut alors exécuter agent-browser navigate, agent-browser click @ref, etc. L’efficacité du contexte est ici vraiment utile pour les longues sessions de codage.

Le test final : la mise à l’échelle

Avec l’API Browser, la mise à l’échelle est largement abstraite. La chaîne de connexion reste la même, que vous exécutiez 5 sessions simultanées pour les tests ou 2 000 pour un crawl de production. L’équilibrage de charge, la récupération des sessions et la distribution géographique sont tous gérés par Bright Data.

L’infrastructure prend en charge un nombre illimité de sessions de navigation simultanées, maintient une disponibilité du réseau de 99,99 % et traite plus de 2 milliards de requêtes quotidiennes sur l’ensemble de la plateforme. Les temps de réponse moyens sont d’environ 0,7 seconde pour les Proxys résidentiels et de 0,24 seconde pour les Proxys de centres de données.

La mise à l’échelle d’Agent Browser est de votre responsabilité. Pour un déploiement sans serveur, vous pouvez utiliser le package Chromium léger (50 Mo contre 684 Mo pour la version complète) et configurer Vercel Fluid Compute pour minimiser les démarrages à froid. Plusieurs sessions isolées s’exécutent via le drapeau --session.

Cela fonctionne bien pour des charges de travail modérées et une utilisation en développement. Mais lorsque vous dépassez quelques centaines de sessions simultanées, vous devrez gérer la logique de réessai, l’isolation des sessions et la distribution géographique que Bright Data gère par défaut. Pour les charges de travail de production à haut volume, cette surcharge opérationnelle s’accumule.

Tarification

pricing

L’API du navigateur facture en fonction de la bande passante :

Plan Coût mensuel Données incluses Prix effectif $/Go
Paiement à l’utilisation 0 0 8
Croissance 499 71 Go ~7,00
Entreprise 999 158 Go ~6,00
Échelle 1 999 400 Go ~5,00

Agent Browser est gratuit sous Apache 2.0. Vous ne payez rien pour l’interface CLI elle-même.

Cependant, si votre cas d’utilisation implique des sites protégés, vous devrez probablement ajouter des services externes. Voici un exemple concret de ce à quoi cela pourrait ressembler :

  • Browserbase pour les navigateurs cloud avec anti-bot : ~150 $/mois
  • 2Captcha pour les CAPTCHA que Browserbase ne peut pas résoudre : environ 47 $/mois
  • Module complémentaire de Proxy résidentiel pour les sites qui vous bloquent encore : environ 120 $/mois

Cela représente un total d’environ 317 $/mois, auquel s’ajoute l’effort d’intégration consistant à relier trois services distincts et à déboguer trois tableaux de bord en cas de panne.

Pour les workflows de développement sur des sites non protégés, Agent Browser ne coûte vraiment rien. Pour l’accès en production à des sites protégés, l’infrastructure groupée de Bright Data peut s’avérer moins coûteuse que l’assemblage d’une pile comparable à partir de fournisseurs individuels.

Le fossé infrastructurel

Après avoir testé les deux outils de manière approfondie, j’ai conclu que l’infrastructure détermine le taux de réussite des agents IA accédant au web.

En réalité, Vercel a développé un excellent outil d’optimisation contextuelle. Pour les workflows de développement sur des sites coopératifs, vous pouvez l’utiliser quotidiennement. Cependant, sa limitation majeure est qu’Agent Browser ne dispose pas de fonctionnalités anti-bot intégrées. Il fonctionne localement ou dans des environnements sans serveur à l’aide de Chromium standard, ce qui signifie :

  • Pas de rotation de Proxy (votre IP est bloquée)
  • Pas de résolution de CAPTCHA (intervention manuelle requise)
  • Pas de gestion des empreintes digitales (détectées par navigator.webdriver)
  • Pas d’optimisation des empreintes digitales TLS (bloquées au niveau du réseau)

Pour accéder à des sites web protégés, vous devez intégrer des services externes tels que Browserbase, Browser Use ou Kernel via le drapeau -p. Cela ajoute de la complexité, des coûts et des points de défaillance potentiels.

Bright Data a mis en place une infrastructure d’accès au web. Pour les agents de production qui accèdent à des sites web réels, le réseau IP de 150 millions d’adresses, la Résolution de CAPTCHA et la gestion des empreintes digitales ne sont pas des fonctionnalités. Ce sont des exigences.

Le choix entre « gratuit ou payant » passe à côté de l’essentiel. La question est la suivante : à quoi votre agent doit-il accéder et quel taux de réussite vous faut-il ? Pour les sites protégés à grande échelle, les équipes qui gèrent des charges de travail de production constatent régulièrement que le fait de combiner plusieurs solutions ajoute plus de coûts et de complexité qu’il n’en économise. L’infrastructure groupée de Bright Data coûte plus cher, mais offre davantage.

Comparaison côte à côte

Voici une comparaison des deux solutions sur plusieurs aspects clés :

Aspect API Bright Data Browser Agent Vercel Browser
Objectif principal Contournement anti-bot et accès Web Efficacité contextuelle pour les agents IA
Infrastructure Cloud géré avec plus de 150 millions d’adresses IP Local ou sans serveur (apportez le vôtre)
Réseau Proxy Intégré, 195 pays Aucun (nécessite un fournisseur externe)
Résolution de CAPTCHA Automatique, plus de 8 types pris en charge Aucun intégré
Gestion des empreintes digitales Contrôle complet des signatures du navigateur Aucun (détectable)
Efficacité contextuelle Standard (état complet de la page) Réduction de 93 % via instantané + références
Tarification 5 à 8 $/Go de bande passante Gratuit (licence Apache 2.0)
Évolutivité Sessions simultanées illimitées Limité par les ressources locales/sans serveur
Intégrations IA LangChain, LlamaIndex, serveur MCP Basé sur CLI (Claude Code, Cursor, etc.)

Conclusion

Bright Data Browser API et Vercel Agent Browser sont conçus pour répondre à différents aspects d’un même problème : fournir aux agents IA un accès fiable et efficace au Web.

Vercel Agent Browser est le choix idéal lorsque vos agents opèrent sur des sites coopératifs et que l’efficacité des jetons constitue un goulot d’étranglement. Avec une réduction du contexte de 93 % et un temps de démarrage inférieur à 50 ms, cet outil est véritablement utile pour les workflows de développement, les assistants de codage et les agents à vérification automatique. Pour ce cas d’utilisation, il est difficile de trouver mieux.

Mais le développement et la production sont des environnements différents. Lorsque vos agents doivent accéder à des sites web réels et protégés à grande échelle, la conversation passe des budgets de jetons aux taux de réussite. Bright Data Browser API offre des taux de réussite supérieurs à 98 % sur des domaines difficiles, la Résolution de CAPTCHA automatique sur plus de 8 types et des sessions simultanées illimitées soutenues par plus de 150 millions d’adresses IP dans 195 pays. Cette infrastructure n’est pas facultative pour les agents de production. C’est la base sur laquelle ils fonctionnent.

Pour les équipes qui développent des agents IA devant fonctionner de manière fiable sur le web ouvert, l’API Bright Data Browser fournit cette base prête à l’emploi.

Lectures complémentaires