Menu d'accessibilité passer au contenu
day1

MCP Launch Week Day 1

5 min de lecture

Semaine de lancement du MCP, jour 1

Aujourd’hui, nous lançons la semaine de lancement du MCP Web. Nous publions Tool Groups, une nouvelle fonctionnalité de notre serveur MCP qui résout le plus grand goulot d’étranglement dans les flux de travail des agents : la pollution contextuelle.

Vous pouvez désormais configurer votre serveur MCP pour qu’il ne charge que les outils dont vous avez besoin (par exemple, ?groups=social ou ?groups=ecommerce), ce qui réduit considérablement l’utilisation des jetons et augmente la précision des agents.

Le problème : le piège des « tous les outils »

Au début de MCP (et par « début », nous entendons il y a 3 mois), le modèle standard était simple : exposer toutes les capacités offertes par votre API sous forme d’outil.

Pour Bright Data, cela pose un problème. Notre réseau propose des Jeux de données pour Amazon, LinkedIn, TikTok, Google Maps, Zillow, des données financières et l’automatisation brute des navigateurs. Si nous chargions chaque jeu de données et chaque Scraper sur le serveur, nous exposerions plus de 200 outils distincts.

Lorsqu’un client MCP (comme Claude Desktop ou Cursor) se connecte à un serveur, il transfère toutes ces définitions d’outils (noms, descriptions et schémas JSON) dans l’invite système.

Cela crée deux problèmes critiques :

  1. Pollution contextuelle : le LLM est distrait par 45 outils dont il n’a pas besoin. Il peut halluciner un paramètre provenant d’un outil Instagram alors qu’il essaie de scraper Amazon.
  2. Inefficacité des jetons : vous payez pour des milliers de jetons d’entrée juste pour définir les outils, avant même que l’utilisateur ne tape « Bonjour ».

La solution : les groupes d’outils à portée limitée

Nous avons refactorisé notre serveur MCP pour prendre en charge des groupes d’outils modulaires. Au lieu d’un serveur monolithique, vous pouvez désormais traiter le serveur comme un ensemble de capacités composables.

Nous avons organisé nos jeux de données en domaines logiques :

  • ECOMMERCE: Amazon, Walmart, eBay, Google Shopping
  • MÉDIAS SOCIAUX: TikTok, Instagram, Facebook, Reddit, X (Twitter)
  • BUSINESS: LinkedIn, Crunchbase, Google Maps, Zillow
  • RECHERCHE: dépôts GitHub, actualités Reuters, sources universitaires
  • FINANCE: données boursières, tendances du marché, actualités financières
  • APP_STORES: iOS App Store, Google Play
  • NAVIGATEUR: Suite complète d’automatisation du Navigateur de scraping
  • ADVANCED_SCRAPING: opérations par lots et utilitaires à haut débit

Comment ça marche

En arrière-plan, nous avons mis en place une logique de filtrage qui intercepte la demande d’initialisation. Lorsque vous configurez votre client, il vous suffit d’ajouter les groupes dont vous avez besoin à l’URL.

Pour un agent de commerce électronique :

https://mcp.brightdata.com/mcp?token=<VOTRE-jeton-API>&groups=ecommerce
# OU via les variables d'environnement pour STDIO
GROUPS=ecommerce

Pour un agent d’analyse des réseaux sociaux :

https://mcp.brightdata.com/mcp?token=<VOTRE-jeton-API>&groups=social

Tout le monde dispose par défaut des outils de base (search_engine et scrape_as_markdown). Le serveur construit ensuite dynamiquement la liste des outils :

// Logique simplifiée de notre server.js
function build_allowed_tools(groups = [], tools = []) {
    const allowed = new Set(base_tools);
    for (let groupId of groups) {
        const group = GROUPS[groupId];
        if (group) {
             // Ajouter uniquement les outils spécifiques à ce groupe
            group.tools.forEach(t => allowed.add(t));
        }
    }
    return allowed;
}

Le futur « exécution de code » contre le présent « outil »

Pourquoi est-ce si important à l’heure actuelle ?

Le secteur connaît actuellement une mutation profonde. Des articles et des démonstrations récents d’Anthropic et de Cloudflare mettent en évidence une évolution vers l’« exécution de code » et l’« utilisation d’ordinateurs ». L’idée est qu’au lieu d’appeler get_amazon_review(asin: « 123 »), le modèle écrira simplement un script Python ou exécutera une commande bash pour récupérer les données lui-même.

Nous croyons fermement en cet avenir. Il permet au modèle d’être créatif plutôt que limité par des schémas API rigides.

Cependant, nous n’en sommes pas encore là.

La plupart des clients MCP actuels sont encore strictement centrés sur les outils. Ils s’appuient sur le serveur pour définir explicitement chaque action que le modèle peut effectuer. Si vous déposez 100 Jeux de données dans la fenêtre de contexte, le modèle se dégrade.

Les groupes d’outils constituent le pont. Ils vous offrent la puissance de l’infrastructure de données massive de Bright Data sans submerger la génération actuelle d’agents IA. Ils permettent de garder votre fenêtre de contexte propre et le raisonnement de votre agent précis.

Impact sur les performances

En utilisant les groupes d’outils, nous avons constaté des améliorations significatives dans la fiabilité des agents.

Comparaison de la consommation de jetons

Vous trouverez ci-dessous une comparaison montrant la réduction spectaculaire de l’utilisation des jetons lorsque vous utilisez des groupes d’outils spécifiques par rapport au chargement de tous les outils (mode Prod avec 62 outils à 7 358 jetons) :

Principales conclusions

  • Réduction de 78,5 % à 94,6 % des jetons pour tous les groupes d’outils par rapport au chargement des 62 outils
  • Les groupes Finance et Voyage affichent la meilleure optimisation avec une réduction de 94,6 % (seulement 401 jetons contre 7 358)
  • Le groupe des réseaux sociaux affiche la plus forte utilisation de jetons, avec 2 823 jetons, en raison de schémas d’outils plus complexes, mais réalise tout de même une économie de 61,6 %.
  • Taux de réussite plus élevé dans la sélection des paramètres (le modèle est moins susceptible de confondre linkedin_url et facebook_url)
  • Latence réduite lors de la connexion initiale

Essayez-le

Le serveur Web MCP est open source et disponible dès maintenant.

  • Pour commencer : consultez la documentation pour configurer votre premier agent.
  • Offre gratuite : inscrivez-vous pour bénéficier de 5 000 requêtes gratuites par mois sur nos outils de base (search_engine et scrape_as_markdown).

Bonne création !

Prêt à commencer?
Explorez le serveur MCP Web et commencez à construire des agents AI puissants.
Lire la documentation Voir le dépôt