Scrapy proxy integation

Scrapy Proxy Integration

This guide may be outdated. For an up-to-date guide please see our documentation.

What is Scrapy?

Scrapy is a Python framework for web crawling and scraping, which allows users to extract structured data from websites. It is open-source, fast, and extensible. Scrapy can be used for various purposes, such as data mining, monitoring, and automated testing.

Scrapy integration with Bright Data proxies

Open your preferred IDE and start a new scrapy project, type in the command line :

      scrapy startproject <project_name>
    

This will create a new folder with the project name, within the folder open a python file.

  • Go to your Bright Data Control Panel and clicking the ‘Proxies & Scraping Infra’ icon
  • Create a new proxy zone by clicking ‘Add’, choosing a network type, configuring the proxy, and clicking save
  • Under your proxy-zone’s ‘Access parameters’ tab, you will find your ‘USERNAME’ and ‘PASSWORD’ values.
  • In your scrapy spider code file, within the request’s meta parameter set the ‘proxy’ value to be the following, using the ‘USERNAME’ and ‘PASSWORD’ values from before: “http://USERNAME:[email protected]:33335
  • For Example:
      import scrapy

class BrightdatascrapyexampleSpider(scrapy.Spider):
name = "BrightDataScrapyExample"

def start_requests(self):
request = scrapy.Request(url="http://example.com",callback=self.parse)
request.meta['proxy'] = "http://USERNAME:[email protected]:33335"
yield request

def parse(self, response):
print(response.body)

Then run the following command in your command line :

      scrapy runspider <Pythonfilename.py>
    

How To Use Bright Data Proxy Manger With Scrapy

  • Create a proxy zone same as in the direct integration above
  • Install the Proxy Manager
  • Click ‘add new port’ and configure it for your use case
  • In your Scrapy spider code file, within the request’s meta parameter set the ‘proxy’ value to be the following: “http://IP:PORTNUMBER”
  • The local host IP is 127.0.0.1 – this is the value you need to use if the proxy manager is installed on your machine. If the proxy manager is installed on an external server, input that server’s IP address
  • The port created in the Proxy Manager is 24XXX, for example, 24000 – the default first port number
  • For example:
      import scrapy

class BrightdatascrapyexampleSpider(scrapy.Spider):
name = "BrightDataScrapyExample"

def start_requests(self):
request = scrapy.Request(url="http://example.com",callback=self.parse)
request.meta['proxy'] = "http://127.0.0.1:24000"
yield request

def parse(self, response):
print(response.body)

⚠️Important note: If you are using Bright Data’s Residential Proxies, Web Unlocker or SERP API, you need to install an SSL certificate to enable end-to-end secure connections to your target website(s). This is a simple process, see https://docs.brightdata.com/general/account/ssl-certificate#installation-of-the-ssl-certificate for instructions.

Get proxies for Scrapy

proxy badges

Alimenté par une infrastructure de proxy résidentiel primée

Plus de 400M+ monthly d’adresses IP résidentielles, la meilleure technologie avec la possibilité de cibler n’importe quel pays, ville et opérateur mobile font de nos services de proxy premium le meilleur choix pour les développeurs.

Proxy Network Pricing

50% DE RÉDUCTION
pay as you go plan icon
Pay as you go
$8 $4.00 / GB
Sans engagement
Essai gratuit
Utilisez ce code de coupon : RESIGB50

Utilisez nos proxies sans engagement mensuel
50% DE RÉDUCTION
2nd plan icon
141 Go inclus
$7 $3.50 / GB
$499 Facturation mensuelle
Essai gratuit
Utilisez ce code de coupon : RESIGB50

Idéal pour les petites entreprises ayant des besoins modérés
50% DE RÉDUCTION
3rd plan icon
332 Go inclus
$6 $3.00 / GB
$999 Facturation mensuelle
Essai gratuit
Utilisez ce code de coupon : RESIGB50

Conçu pour les grandes équipes ayant des besoins opérationnels étendus
50% DE RÉDUCTION
4th plan icon
798 Go inclus
$5 $2.50 / GB
$1999 Facturation mensuelle
Essai gratuit
Utilisez ce code de coupon : RESIGB50

Optimisé pour les entreprises gérant des opérations à grande échelle
Vous avez besoin de plus de 1 To ?
CONTACTEZ-NOUS
  • Volumes de données illimités
  • Places illimitées
  • Accord de service Premium
  • 99.99% de disponibilité du réseau
  • Proxy Manager gratuit
  • Couverture complète des données
  • Prix sur mesure par Go
  • Solutions sur mesure
pay as you go plan icon
Pay as you go
$8 / GB
Sans engagement
Essai gratuit
Utilisez nos proxies sans engagement mensuel
2nd plan icon
71 Go inclus
$7 / GB
$499 Facturation mensuelle
Essai gratuit
Idéal pour les petites entreprises ayant des besoins modérés
3rd plan icon
166 Go inclus
$6 / GB
$999 Facturation mensuelle
Essai gratuit
Conçu pour les grandes équipes ayant des besoins opérationnels étendus
4th plan icon
399 Go inclus
$5 / GB
$1999 Facturation mensuelle
Essai gratuit
Optimisé pour les entreprises gérant des opérations à grande échelle
Vous avez besoin de plus de 1 To ?
CONTACTEZ-NOUS
  • Volumes de données illimités
  • Places illimitées
  • Accord de service Premium
  • 99.99% de disponibilité du réseau
  • Proxy Manager gratuit
  • Couverture complète des données
  • Prix sur mesure par Go
  • Solutions sur mesure
pay as you go plan icon
Pay as you go
$0.6 / GB
Sans engagement
Essai gratuit
Utilisez nos proxies sans engagement mensuel
2nd plan icon
1 To inclus
$0.51 / GB
$499 Facturation mensuelle
Essai gratuit
Idéal pour les petites entreprises ayant des besoins modérés
3rd plan icon
2 To inclus
$0.45 / GB
$999 Facturation mensuelle
Essai gratuit
Conçu pour les grandes équipes ayant des besoins opérationnels étendus
4th plan icon
5 To inclus
$0.42 / GB
$1999 Facturation mensuelle
Essai gratuit
Optimisé pour les entreprises gérant des opérations à grande échelle
Vous avez besoin de plus de 1 To ?
CONTACTEZ-NOUS
  • Volumes de données illimités
  • Places illimitées
  • Accord de service Premium
  • 99.99% de disponibilité du réseau
  • Proxy Manager gratuit
  • Couverture complète des données
  • Prix sur mesure par Go
  • Solutions sur mesure
Nous acceptons ces méthodes de paiement:

La meilleure expérience client du secteur

Nous développons pour vous

De nouvelles fonctionnalités tous les jours

Support 24h/24, 7j/7

Pour répondre à toutes vos questions quand vous en avez besoin

Une transparence totale

Tableau de bord des performances en temps réel

Chargés de comptes dédiés

Pour optimiser votre performance

Solutions sur mesure

Pour atteindre vos objectifs de collecte de données

Leader de la catégorie des proxys et de la collecte de données

650 To de données publiques collectés chaque jour
De nouvelles fonctionnalités sont publiées chaque jour
Montée en échelle de qualité entreprise
Une note exceptionnelle de 4.6/5 sur TrustPilot

Ready to get Scrapy proxies?