[Vidéo] Ce que 15 analystes de données ont à dire sur les données web

Plus de quinze data scientists, ingénieurs de données, ingénieurs MLOps et analystes de données se sont récemment réunis pour discuter des derniers défis et opportunités dans le domaine des données web et des raisons pour lesquelles les solutions de Bright Data changent véritablement la donne.
4 min de lecture

Nous présentons ici une discussion particulièrement remarquable animée par Ken Jee, qui portait sur le point de vue des influenceurs en matière de données web, ainsi qu’une séance de questions-réponses enthousiaste en direct avec les spectateurs de YouTube.

Mark Freeman, data scientist dans une start-up, a lancé la discussion en abordant ce qu’il a appelé la « complexité » de la récupération de données web de qualité sans utiliser un outil de collecte de données tel que Bright Data.

« J’ai participé à des projets où nous essayions de créer le MVP de quelque chose et le simple fait de trouver les données représentait un énorme défi. »

Shashank Kalanithi, ingénieur et influenceur dans le domaine des données Internet, a poursuivi en évoquant les difficultés courantes liées aux données :

« Pour moi, le plus difficile dans [tout projet] est d’obtenir de bonnes données. J’ai essayé de scraper plusieurs sites d’offres d’emploi pour obtenir des données en temps réel, mais j’ai été bloqué à presque chaque fois. Il est regrettable que les données publiques sur le Web ne soient pas toujours facilement accessibles. »

Miki Bazeley, ingénieur MLOps de renom, a poursuivi en expliquant les défis techniques qui existent aujourd’hui dans l’extraction de données web, et pourquoi des solutions telles que Bright Data sont si intéressantes.« Si vous êtes une grande entreprise ou une start-up et que vous essayez d’avancer rapidement, l’un des meilleurs moyens d’yparvenir est de ne pas avoir à ralentir parce que vous passez votre temps à corriger des problèmes. »

Open Discussion on Web Data Collection
Discussion ouverte sur la collecte de données web #BrightDataHouse

Zach Wilson, de la chaîne Youtube @Datawithzack, a également décrit avec beaucoup d’enthousiasme les avantages d’un outil automatisé tel que Bright Data.

L’une des choses les plus courantes que les entreprises peuvent faire avec les données web est d’obtenir de meilleures informations sur leurs concurrents. Si vous disposez d’une plateforme compétitive… ce n’est pas comme si vos concurrents allaient vous fournir ces données sur simple demande. Ils vont vous compliquer la tâche, et c’est là que les données web peuvent s’avérer vraiment très utiles. En raison de la nature des contrats, votre Scraper va probablement tomber en panne. C’est ce que j’apprécie vraiment chez Bright Data. Il peut valider votre Scraping web. »

Le groupe, d’accord, s’est ensuite penché sur les solutions presque impeccables de Bright Data. « Il peut être très utile d’externaliser… et encore une fois, c’est l’un des aspects vraiment intéressants de Bright Data… Ils utilisent un système de Proxy incroyable », a déclaré Ken Jee. « Si vous avez une entreprise et que vos produits ou vos modèles dépendent de données externes, cela peut être vraiment peu fiable. Il est très difficile de construire une infrastructure autour de cela si elle change constamment. Il est évident que Bright Data est la meilleure solution, car ils la maintiennent et vous la leur externalisez essentiellement. »

Ken a alors demandé au groupe : « Est-ce la meilleure solution ? »

Le groupe de plus de quinze influenceurs de premier plan dans le domaine des données à travers le monde a approuvé. En effet, Bright Data est aujourd’hui la solution de données la plus intéressante. Ne manquez pas de regarder la vidéo complète pour voir l’intégralité de la discussion des « data avengers », ainsi que leur point de vue passionnant sur la boîte à outils de Bright Data !