Film

LA RÉVOLUTION
DES DONNÉES WEB

La révolution des données web

2022 | 10m  12s | Technologie et business

Ce court documentaire explore la façon dont les données publiques modifient la façon dont les entreprises voient, réfléchissent et prennent des décisions.

La révolution des données web

Comment les données publiques changent la façon dont les entreprises voient, réfléchissent et prennent des décisions

On raconte que, peu après avoir fondé la chaîne Walmart, Sam Walton vérifiait si les affaires étaient bonnes dans ses magasins en comptant le nombre de voitures dans le parking. Maintenant, imaginez s’il avait pu compter les voitures dans chaque Walmart et recouper ces données avec les promotions locales afin d’optimiser ses publicités ? Ou s’il avait pu surveiller les variations des prix en ligne de tous ses concurrents en fonction de leur code postal afin d’affiner ses stratégies de tarification ? Ou s’il avait pu identifier la marque, le modèle et l’âge de chaque voiture pour décider des meilleurs emplacements pour créer des garages ? Soixante ans après que Sam a ouvert son premier magasin, il est clairement possible de répondre à toutes ces questions – auxquelles il aurait été impossible de répondre à l’époque – grâce à notre capacité de collecte de données web. De ce fait, les salles de conseil, les laboratoires de produits et les services de marketing de nombreuses grandes entreprises ressemblent de plus en plus à des agences de renseignement. Cette révolution est en partie technique : de vastes réseaux de serveurs proxys, spécialement conçus pour la collecte de gros volumes de données web publiques, permettent désormais de recueillir, structurer et interpréter des données grâce à des méthodes nouvelles et extrêmement efficaces. Il s’agit d’une transformation aussi significative que celle introduite par Salesforce dans le domaine la gestion de la relation client ou de celle initiée par Slack dans le domaine de la messagerie d’entreprise. Il s’agit aussi d’une révolution conceptuelle : l’art du leadership dépend désormais moins de la capacité à trouver de bonnes réponses que de la capacité à formuler de bonnes questions. Si vous posez les bonnes questions, votre avantage concurrentiel pourra sembler disproportionné pour un observateur extérieur. Mais poser les bonnes questions ne se fait pas toujours naturellement. Combien de temps consacrez-vous à faire des recherches avant de prendre une décision importante ? Pour beaucoup d’entre nous, la réponse est : pas beaucoup. Les êtres humains font naturellement des hypothèses pour simplifier un monde complexe : ils repèrent des modèles, tirent parti de leurs expériences passées, partagent des conseils et suivent leur instinct. Bien souvent, ce mode de pensée est étonnamment précis, mais il comporte des dizaines d’angles morts, comme le biais de récence, qui signifie que nous comptons trop sur nos souvenirs les plus récents, le biais de confirmation, qui consiste à rechercher inconsciemment des informations qui confirment ce que nous croyons déjà, et le biais de narration, qui est la tendance humaine à croire à la meilleure histoire plutôt qu’aux données les plus sûres. Tirer parti de la révolution des données publiques nécessite une approche plus zen. Il s’agit d’aborder les décisions commerciales sans idées préconçues, même lorsque nous étudions des situations que nous pensons très bien connaître. Faire abstraction de ces idées préconçues peut vous aider à tomber sur des informations nouvelles, comme le ferait un débutant. Vous pouvez ainsi découvrir des informations cachées mais clairement accessibles, comme la façon dont le nombre de voitures dans le parking est corrélé au nombre de dollars engrangés. Les données vous permettent d’observer la dynamique du marché à travers les produits, les prix, les stocks, les chaînes d’approvisionnement et les comportements des consommateurs. Elles vous indiquent ce que font les clients, dévoilent les tendances critiques et peuvent même vous aider à anticiper ce que vos concurrents feront par la suite. La collecte de données web publiques est arrivée à un point de basculement. Les entreprises qui ont manqué le développement d’Internet ou de l’économie mobile l’ont payé au prix fort. Si vous passez à côté de la révolution des données web, vous risquez de connaître les mêmes déconvenues que Blockbuster en son temps. Quelle est la rapidité de cette croissance ? Chez Bright Data, nous traitons 15 milliards de requêtes par jour, soit plus de 1,5 fois plus que tous les moteurs de recherche du monde réunis. Et ce nombre ne cesse de croître. Les réponses sont là. Voici quelques-unes des bonnes questions que nos clients posent pour les trouver :
Un analyste en investissements demande :

« Quelle est la tendance des prix au détail de l’eau de Javel ? »

Micah est analyste dans un hedge fund de Boston, qui subit beaucoup de pression pour générer de nouvelles idées d’investissements. Une société de produits chimiques retint son attention alors qu’il parcourait ses screeners d’actions. Les chiffres de cette société semblaient solides, mais il voulait déterminer si elle pouvait maintenir son avantage tarifaire dans un environnement inflationniste. C’est à ce moment-là qu’il eut une idée : comme la société était l’un des plus grands fournisseurs de l’industrie de l’eau de Javel, Micah pouvait suivre les prix de l’eau de Javel sur tous les marchés alimentés par la société. Il découvrit une tendance claire à la hausse des prix au détail, ce qui indiquait que la société disposait d’un avantage tarifaire et pouvait probablement préserver ses marges. Dans le contexte actuel des investissements, les données web publiques comme celle-ci sont appelées données alternatives, et la plupart des hedge funds les utilisent pour compléter leurs sources conventionnelles de données telles que les appels à résultats et les rapports annuels. Pensez à l’imagerie aérienne des centres de distribution, à l’écoute des réseaux sociaux pour déterminer le sentiment des investisseurs ou à la surveillance météorologique pour prédire les récoltes.

Le marché mondial des données alternatives devrait connaître une croissance annuelle de 46,5 % et atteindre 13,91 milliards de dollars d’ici 2026.

Source : Alternative Data Global Market Report 2022
Une directrice marketing demande :

« Comment les gens vendent-ils mon produit en ligne ? »

Jill est Directrice du marketing pour une marque de mode européenne, où sa tâche est de maintenir une image de marque et une expérience client irréprochables. Cela signifie que chaque photo doit être parfaite. Les descriptions doivent être correctes. Les promotions doivent suivre les campagnes saisonnières. Il ne peut y avoir de soldes ou de remises non autorisés. Les délais de livraison doivent être rapides. Mais, dans un monde où vous avez affaire à des dizaines de milliers de revendeurs en ligne, comment maintenir l’intégrité de sa marque ? Pour l’équipe de Jill, la réponse se trouve dans les données web publiques. Elle recherche continuellement sur Internet des informations sur ses produits et fournit les résultats à un algorithme qui peut l’avertir de tout résultat problématique. La possibilité de rechercher des textes, des images, des fichiers audio et vidéo à grande échelle est utilisée pour protéger toutes sortes de marques et leur propriété intellectuelle. Cela aide les artistes à repérer les utilisations de leur travail sur Internet et permet aux plateformes de réseaux sociaux de bloquer le chargement non autorisé de leurs créations.
Bright Data analyse environ un pétaoctet de données chaque jour. Cela représente 500 milliards de pages de texte, soit plus de 100 000 films de qualité DVD.

Même si vous recherchez une aiguille dans une botte de foin, nous pouvons la trouver.

Le CEO d’un site de voyages demande :

« Comment puis-je proposer les meilleures offres de voyage au monde ? »

La société de Bert vit ou meurt par le trafic web. Son défi est de s’assurer que son site web reste la destination la plus précise et la plus complète sur Internet pour agréger les offres proposées par les agences de voyages, les hôtels et les compagnies aériennes. Bien que de nombreux prestataires de voyages lui fournissent par le biais d’API des informations de base telles que leurs tarifs et leurs horaires, ces données sont souvent fragmentées, obsolètes ou incomplètes. La solution de Bert ? Il recueille en permanence les offres les plus récentes sur le web. Il obtient les données dans un format qui permet à son équipe de les trier par algorithmes et de les présenter aux consommateurs afin qu’ils puissent facilement repérer le meilleur prix, l’itinéraire le plus court, la date parfaite et même le Wi-Fi gratuit si c’est cela qui est important pour eux. Les données web sont très efficaces pour les agrégateurs comme Bert, que vous souhaitiez recueillir des offres de carte de crédit ou les offres des meilleures sociétés d’entretien de pelouse. Elles conviennent également aux fournisseurs finaux – par exemple, les hôtels qui figurent sur le site de Bert peuvent recueillir des données pour comparer leurs tarifs à ceux de la concurrence.
Will.i.am, musicien devenu investisseur en technologie, a déclaré que « www signifie Wild Wild West » (le Far West).

L’extraction de données web publiques permet de mettre de l’ordre et de la structure dans le chaos d’Internet.

La fondatrice d’une startup demande :

« Comment mon produit peut-il se démarquer de la concurrence ? »

Maia a créé un excellent produit : des écouteurs avec égaliseur intégré, qui vous permettent de personnaliser le son en fonction des changements auditifs liés à l’âge. Mais elle sait que son produit ne décollera jamais sans une stratégie d’entreprise forte. Sa première démarche a consisté à utiliser des outils publics de collecte de données pour découvrir tous les produits concurrents sur Amazon et d’autres sites de vente au détail. Elle a construit une base de données de prix, de fonctionnalités, de classements et de tout ce qui pouvait l’aider à positionner son produit au mieux. Par la suite, nous avons mis en place un suivi continu des données concurrentielles, des prix, remises, niveaux de stock et délais de livraison par rapport à des variables telles que les couleurs, les ventes incitatives et les avis des utilisateurs. En outre, chacune de ces variables pouvait être segmentée par pays et par région, jusqu’à l’indicatif régional. Tout cela a donné à Maia un avantage significatif pour mettre en place ses entonnoirs de marketing, ses stratégies de tarification et ses promotions par e-mail. Pratiquement toutes les entreprises de commerce en ligne peuvent suivre cette approche pour capturer et structurer des données web en informations concrètes et exploitables.
« Internet est la plus grande base de données au monde et vous pouvez désormais la consulter » – Or Lenchner, PDG de Bright Data.

Imaginez que vous ayez un moteur de recherche conçu pour vous donner des informations commerciales exploitables.

Vous pouvez voir la collecte de données web comme une séance de lecture de tous les livres de la bibliothèque municipale. Les fournisseurs tels que Bright Data ont tout intérêt à garder cette bibliothèque ouverte et à prendre des précautions supplémentaires pour en assurer l’intégrité. Nous le faisons par le biais d’un code d’éthique et grâce à des protocoles logiciels qui empêchent toute utilisation abusive de la technologie. Nous considérons la collecte et l’analyse des données web publiques comme un développement positif important pour la société. Il s’agit d’un avantage concurrentiel important pour les entreprises, qui élargit le choix des consommateurs et nous aide également à nous attaquer à certaines des questions environnementales et sociales les plus importantes de notre époque.
Par exemple, l’année dernière, un beau matin de printemps, la police a enfoncé la porte d’un appartement dans le sud de Chicago. Une fois à l’intérieur, les policiers ont arrêté deux personnes soupçonnées de trafic d’êtres humains. Ils ont secouru quatre femmes, âgées de 17 à 26 ans, et récupéré de l’argent, de la drogue et des armes. Ces arrestations s’inscrivent dans le cadre d’une opération qui a permis de recueillir des données de publicités sexuelles commerciales en ligne grâce à la mise en œuvre de techniques d’analyse de données et de réseaux pour identifier les activités de trafic potentielles. Cette histoire a été rendue possible par la Bright Initiative – notre engagement continu à utiliser la collecte de données web publiques pour favoriser le progrès dans des domaines comme les droits de l’homme, les réglementations, le changement climatique, la santé publique et la sécurité sur Internet.
Aujourd’hui, la courbe d’adoption des données web monte en flèche. Les utilisateurs posent des questions intelligentes et trouvent des réponses pertinentes dans tous les domaines possibles, de l’immobilier à la gestion d’actifs, en passant par la fabrication industrielle, la musique, les startups et les multinationales. Imaginez un instant que vous soyez la seule personne sur Terre qui ait accès à Google. Vous auriez probablement une excellente note à chaque examen, vous prendriez le meilleur sur tous les autres au fur et à mesure de votre parcours et vos connaissances exceptionnelles vous permettraient de vous faire de très bons amis. Il deviendrait probablement évident que vous disposez d’un avantage secret. Maintenant, pensez à Micah qui propose les meilleures idées d’investissements. À Jill qui construit une marque synonyme de perfection. À Bert qui dompte le secteur des voyages. À Maia qui fait décoller sa start-up. Sans parler de tous les actes de justice et d’héroïsme rendus possibles par la magie des données web. Les outils de collecte de données web sont comme un super-pouvoir. Et au rythme actuel des changements en cours, ne pas saisir cette opportunité dès maintenant pourrait vous laisser avec ce sentiment de naufrage qui vous envahit quand vous vous rendez compte que vous êtes coincé quelque part où il n’y a pas de Wi-Fi. Mais il n’y a aucune raison que vous vous retrouviez coincé. Les outils sont disponibles, à portée de main. Tout ce que vous devez faire, c’est travailler pour aboutir aux bonnes questions ; ensuite… il suffit de demander.

Obtenez dès aujourd’hui les données web dont vous avez besoin.