Comment fonctionne le web scraping dans Microsoft Excel – guide détaillé

Voici un guide pas à pas rapide et facile sur la façon d’exécuter une requête de données sur le web, directement à partir de votre feuille de calcul Microsoft Excel
5 min read
How Web Scraping in Microsoft Excel Works - A Detailed Guide

Dans ce post, nous parlerons des points suivants :

Collecte de « données de tableau » à l’aide de l’outil Web Query d’Excel

 

Par exemple, la collecte de données avec Excel est beaucoup plus simple que le scraping avec Python. La méthode sur laquelle nous allons nous pencher est idéale si vous ciblez des données web qui sont organisées en lignes et en colonnes (c.-à-d. dans un tableau).    

Voici un guide étape par étape pour vous aider à recueillir des données web cibles et à les importer directement dans un classeur Excel afin de commencer à les trier, à les filtrer et à les analyser :

Étape 1 : ouvrez un nouveau classeur

 

Les points de données doivent être importés dans un espace de travail vide. Ouvrez donc un classeur entièrement nouveau dans Excel ou ajoutez une nouvelle feuille de calcul à un fichier existant.

Source: exceldome

Étape 2 : Exécuter une requête de données web

 

Vous pouvez exécuter une nouvelle requête web en accédant à l’onglet « Données » en haut de votre feuille de calcul Microsoft Excel ; cliquez alors sur le bouton « Obtenir des données », puis sur « À partir d’autres sources », et enfin sur « À partir du web » :

Source: Microsoft

Étape 3 : ajoutez votre URL cible

   

Une nouvelle boîte de dialogue de requête web s’ouvre. Insérez maintenant l’URL qui contient vos données cibles dans un tableau que vous allez collecter. Cliquez ensuite sur « Importer ». Remarque importante : Excel identifie automatiquement tous les tableaux qui figurent dans votre URL cible. Une petite flèche jaune s’affiche à côté des différents tableaux présents sur le site web/dans la boîte de dialogue. Cliquez sur la flèche située en regard du tableau sur lequel vous souhaitez collecter des données. La flèche devient alors une coche verte. Une fois que vous avez terminé cette opération pour tous les tableaux qui vous intéressent, cliquez sur « Importer ».  

Source: Dummies

Étape 4 : décidez où vous souhaitez importer vos données

 

Excel affiche alors la boîte de dialogue « Importer des données ». Choisissez maintenant votre feuille de travail nouvellement ouverte et enregistrée sous l’option « Feuille de calcul existante », ou choisissez d’ouvrir une « Nouvelle feuille de calcul », puis cliquez sur OK.

Source: Dummies

Étape 5 : attendez qu’Excel importe vos données cibles

 

En fonction de votre site cible et du nombre de points de données que vous souhaitez collecter et importer, la procédure peut prendre de quelques secondes à quelques minutes.

Source: Dummies

L’analyse de données web sur Excel

 

Vous pouvez maintenant commencer à travailler avec vos données afin d’en extraire des informations utiles. Par exemple, vous pouvez analyser vos données cibles à l’aide des modèles Excel « Pivot » et « Régression ». Pivot vous permet d’effectuer une analyse de données, de créer des modèles de données ainsi que des jeux de données de référence croisée et d’obtenir des informations utiles à partir des données collectées. Il vous permet également d’afficher des jeux de données et des informations sous forme de diagrammes circulaires/histogrammes, grâce auxquels vous pourrez plus facilement informer vos collègues des tendances observées sur les données.  

Source: Essentialplugins

Découvrez ce tutoriel Hubspot détaillé sur l’analyse de jeux de données à l’aide de la fonction Pivot. L’analyse de régression peut vous aider à comprendre la relation entre les différentes entrées et sorties. Par exemple, la corrélation entre le coût d’un article et les dépenses publicitaires avec le taux de conversion. Cela peut faciliter la prise de décisions stratégiques, par exemple le choix des canaux publicitaires les plus rentables (c’est-à-dire auxquels il est préférable de consacrer les budgets marketing).

Source: excel-easy

Outils de collecte de données automatisés permettant d’extraire des données vers Excel

 

Bien que les proxys anonymes et les emplacements géographiques des IP de proxys disséminés dans le monde entier puissent s’avérer utiles si vous prévoyez de faire une collecte de données, l’automatisation complète des opérations de collecte de données de votre entreprise présente des avantages majeurs.    

Web Scraper IDE, for example, is a leading industry tool for data scraping automation. It enables professionals that need access to information to simply choose their target website (regardless of how the information is organized) and receive data output in their format of choice, including:

  • JSON
  • CSV
  • HTML
  • Microsoft Excel

For those of you that want to utilize Excel’s strong data analysis tools mentioned above, it is very convenient that data can be output at the click of a button directly to an Excel spreadsheet. This can be set up for 1 website or a 1,000, Web Scraper IDE scales operations up or down based on your business’s needs. It can also be programmed to collect data points as frequently or infrequently as necessary (every hour? day? week? month? year?). 

Vous êtes prêt à recevoir vos données cibles directement dans le classeur Microsoft Excel de votre équipe ?  

More from Bright Data

Datasets Icon
Get immediately structured data
Access reliable public web data for any use case. The datasets can be downloaded or delivered in a variety of formats. Subscribe to get fresh records of your preferred dataset based on a pre-defined schedule.
Web scraper IDE Icon
Build reliable web scrapers. Fast.
Build scrapers in a cloud environment with code templates and functions that speed up the development. This solution is based on Bright Data’s Web Unlocker and proxy infrastructure making it easy to scale and never get blocked.
Web Unlocker Icon
Implement an automated unlocking solution
Boost the unblocking process with fingerprint management, CAPTCHA-solving, and IP rotation. Any scraper, written in any language, can integrate it via a regular proxy interface.

Ready to get started?