Le crawling web, c’est tellement 2019

Les Jeux de données fournissent en quelques minutes des instantanés prêts à l’emploi de sites web entiers ou des sous-ensembles intelligents : les prêteurs reçoivent les données des demandeurs de prêts alternatifs, les capital-risqueurs reçoivent des informations sur les accélérateurs de start-ups, tandis que d’autres entreprises voient les scores d’engagement des influenceurs des réseaux sociaux directement intégrés à leurs algorithmes.
7 min de lecture
Web Crawling Is So Last Decade

Dans cet article, nous aborderons les points suivants :

  • Les jeux de données pré-collectés sont plus efficaces et créent plus de valeur que le crawling web
  • Comment les jeux de données sont exploités dans différents secteurs :
  • Jeux de données des réseaux sociaux

Les jeux de données pré-collectés sont plus efficaces et créent plus de valeur que le crawling web 

Depuis l’introduction par Bright Data des Jeux de données prêts à l’emploi, de nombreuses entreprises délaissent le crawling web interne au profit d’un aperçu de sites entiers ou de sous-ensembles intelligents adaptés à leurs besoins en matière de données, fournis directement à leurs équipes. 

Cette option aide les entreprises à gagner en efficacité en termes de :

  • Agilité: les Jeux de données permettent un niveau élevé de flexibilité en termes de flux de travail et de budget, car vous n’avez pas d’« engagement continu » envers vos opérations de collecte de données. Cela signifie que vous pouvez commander un jeu de données sur mesure pour un projet spécifique un mois donné, puis faire une pause et en commander un autre pour une preuve de concept (PoC) plus tard. L’accès aux données joue un rôle de soutien plutôt que de contrainte. 

  • Ressources: les jeux de données ne nécessitent aucune maintenance/entretien, ni aucun matériel/logiciel interne, ni aucune équipe informatique, d’ingénierie ou de DevOps. 

  • TempsLes jeux de données peuvent raccourcir le délai entre les « phases de conceptualisation » et le lancement d’un nouveau produit, d’une nouvelle fonctionnalité ou d’une nouvelle capacité. En effet, il n’y a pas de temps de collecte, ce qui signifie que les données dont vos algorithmes ont besoin peuvent être fournies en quelques minutes. De plus, les jeux de données sont régulièrement actualisés, ce qui vous garantit de disposer d’informations à jour. 

  • RentabilitéLes jeux de données constituent une option plus rentable, car les coûts de mise à l’échelle, d’accès et de maintenance sont répartis entre plusieurs entreprises. Ce « modèle de partage des données » réduit les coûts pour chaque participant individuel. 

Comment les jeux de données sont-ils exploités dans différents secteurs ?

Jeux de données commerciales/financières

Les secteurs tels que l’assurance, l’investissement et le crédit font partie d’industries très réglementées qui peuvent tirer parti des Jeux de données dans leur ensemble, et des Jeux de données alternatifs en particulier. 

Par exemple, les prêteurs institutionnels tentent d’atténuer les risques en créant un profil de l’entreprise ou de la personne qui demande une ligne de crédit. Ils utilisent généralement des « données classiques » telles que :

  • Antécédents/cotes de crédit

  • Ratio revenu/endettement 

Mais le fait de pouvoir alimenter les algorithmes avec une couche supplémentaire d’informations permettant de prendre des décisions concernant les candidats peut ouvrir les institutions à de nouveaux clients à faible ou moyen risque, auparavant négligés. 

Lors de l’évaluation de la solidité financière d’une entreprise, des jeux de données tels que le classement sectoriel, les offres d’emploi, les avis des employés ou des points de données plus « traditionnels » tels que le chiffre d’affaires, la taille de l’entreprise et les cycles d’investissement peuvent fournir des informations pertinentes sur les atouts et la solvabilité d’une entreprise donnée, tout en élargissant la compréhension que l’on a d’une société spécifique.

Pour les particuliers, les prêteurs peuvent utiliser les profils sur les réseaux sociaux afin de mieux comprendre qui est la personne et comment cela pourrait influencer le niveau de risque d’un prêt (fait-elle du parachutisme ? Fait-elle la fête tous les soirs ? etc. 

Ils peuvent également commander un jeu de données prêtes à l’emploi concernant le temps moyen nécessaire aux candidats cibles pour remplir les demandes de prêt en ligne. L’équipede conformité de la First Bank of Omaha, par exemple, recueille ces informations et examine de plus près les demandes présentant un délai inhabituel. Cela s’explique par leurs statistiques internes qui montrent que ces demandes sont plus susceptibles de correspondre à l’un des nombreux profils de fraude. 

En ce qui concerne les investisseurs, les sociétés de capital-risque exploitent des jeux de données afin de s’impliquer dans des entreprises à un stade précoce. Cela s’explique par une forte augmentation des capitaux d’investissement alors que le nombre de start-ups reste stagnant. Dans ce contexte, les jeux de données pertinents prêts à l’emploi comprennent :

  • Analyse de l’ensemble des sites d’accélérateurs de start-ups à la recherche d’entreprises dont les statistiques indiquent une « opportunité de monétisation » (telles que la croissance du nombre d’employés sur une courte période, l’augmentation du nombre d’offres d’emploi, l’activité accrue sur les forums professionnels ou le lancement récent et réussi d’un produit)

  • Explorer l’intégralité des sites d’applications à la recherche d’applications très performantes, téléchargées et bien notées, qui peuvent toutes être révélatrices du taux de croissance/d’adoption d’une entreprise auprès du public cible. 

Jeux de données issus des réseaux sociaux

De nombreuses entreprises ont des modèles commerciaux et des services numériques qui dépendent fortement des réseaux sociaux. Les applications de fitness, les appareils portables et les entreprises dont le modèle commercial repose sur le suivi de la santé en sont de bons exemples. Dans ce contexte, les entreprises commandent des Jeux de données pré-collectés, telles que :

  • Les influenceurs les plus suivis dans le secteur de la santé, de la beauté et du sport – Cela peut inclure des profils complets ou simplement des publications tendance avec des indicateurs d’engagement élevés. Ceux-ci peuvent servir d’indicateurs très réels de l’intérêt, du sentiment et des routines d’entraînement du public cible. Par exemple, il peut y avoir plusieurs publications discutant du désirde«se débarrasser de la graisse abdominale », ce qui peut indiquer un besoin du marché pour un nouveau produit ciblant spécifiquement ce problème ou mettre en lumière des messages publicitaires qui pourraient bien fonctionner pour les gammes de produits existantes.

  • Données secondaires sur les appareils portables ou les applications: de nombreuses personnes utilisent des applications de fitness et des appareils portables tels que des montres intelligentes pour suivre leurs séances d’entraînement. Ces informations sont privées et ne peuvent être collectées, mais beaucoup de gens choisissent de partager leurs résultats sur les réseaux sociaux, où ces données alternatives/secondaires peuvent être recueillies. Ces informations peuvent être extrêmement importantes pour comprendre le type d’entraînement que les gens pratiquent (course à pied ? yoga ?) ainsi que le lieu (dans une salle de sport ? ou dans un parc ?). Ces données peuvent servir à élaborer des campagnes publicitaires, des gammes de produits, de nouvelles fonctionnalités pour les applications de fitness et une multitude d’autres informations qui peuvent aider votre entreprise à devenir un leader du marché axé sur le consommateur. 

Conclusion

Il n’estplus d’actualitéde parcourir activement Internet à la recherche des jeux de données dont votre entreprise a besoin pour prendre des décisions commerciales plus éclairées. C’est une façon de gérer une entreprise qui demande beaucoup de ressources, qui prend du temps et qui est peu pratique. Les jeux de données vous permettent de vous concentrer sur votre activité principale et de commander les données dont vous avez besoin, quand et comme vous le souhaitez (au format JSON, CSV ou Excel).