Ensembles de données d'enrichissement
Gardez une longueur d’avance grâce à des ensembles de données enrichies provenant de sources clés telles que LinkedIn, CrunchBase, Owler et Indeed, qui fournissent des informations précieuses pour l’analyse commerciale et la prise de décision.
- Plus d'un milliard d'enregistrements de données d'enrichissement disponibles
- Obtenez des données d'enrichissement précises provenant de tous les principaux sites web
- Personnalisez le jeu de données d'enrichissement selon vos besoins
Approuvé par 20,000+ clients dans le monde
Échantillon de l'ensemble de données d'enrichissement
Les ensembles de données sur les entreprises ou les individus provenant de sites Web tels que LinkedIn, Crunchbase, Owler, G2, Indeed, Slintel ou Manta sont parfaits pour trouver des opportunités d’investissement, surveiller la croissance, alimenter les algorithmes d’apprentissage automatique, etc.
Ensemble de données Linkedin
L'ensemble de données LinkedIn (profils, entreprises et emplois) couvre tous les principaux points de données et comprend des centaines de millions d'entrées.
Ensemble de données Crunchbase
L'ensemble de données Crunchbase (entreprises) comprend tous les principaux points de données et contient des millions d'entrées.
Ensemble de données Indeed
L'ensemble de données Indeed (emplois et entreprises) couvre tous les principaux points de données et contient des dizaines de millions d'entrées.
Ensemble de données Glassdoor
L’ensemble de données Glassdoor (critiques et aperçu) couvre tous les principaux points de données et contient des dizaines de millions d’enregistrements.
Ensemble de données G2
L’ensemble de données G2 (critiques et aperçu) couvre tous les principaux points de données et contient des centaines de milliers d’enregistrements.
Ensemble de données Yelp
L’ensemble de données Yelp (critiques et aperçu) couvre tous les principaux points de données et contient des centaines de millions d’enregistrements.
Ensemble de données Xing
L’ensemble de données Xing couvre tous les principaux points de données et contient des millions d’enregistrements.
Ensemble de données Trustpilot
L’ensemble de données Trustpilot couvre tous les principaux points de données et contient des centaines de millions d’enregistrements.
Ensemble de données Owler
L’ensemble de données Owler (commentaires et messages) couvre tous les principaux points de données et contient des millions d’enregistrements.
Datasets Pricing
- Propre et validé
- Mise à jour mensuelle
- JSON/CSV/Parquet
Des agents d'intelligence artificielle instantanément performants
Nos ensembles de données Ensembles de données d'enrichissement sont optimisés pour l'IA/LLM : clairement structurés, bien documentés, avec du code et des recettes pour une intégration facile du LLM/chatbot. recettes pour une intégration facile de LLM/chatbot.
Structuré et propre
Des données prétraitées avec des schémas cohérents, parfaites pour la formation et l'inférence de modèles d'IA.
Exemples de codes
Des snippets Python, Node.js, cURL, PHP, Go, Java et Ruby prêts à l'emploi pour une intégration aisée dans les flux de travail de l'IA.
Documentation
curl --request GET
--url https://api.brightdata.com/datasets/snapshots/{id}/download
--header 'Authorization : Bearer '
import requêtes
url = "https://api.brightdata.com/datasets/snapshots/{id}/download"
headers = {"Authorization" : "Bearer "}
response = requests.get(url, headers=headers)
print(response.json())
const url = 'https://api.brightdata.com/datasets/snapshots/{id}/download' ;
const options = {method : 'GET', headers : {Authorization : 'Bearer '}, body : undefined} ;
try {
const response = await fetch(url, options) ;
const data = await response.json() ;
console.log(data) ;
} catch (error) {
console.error(error) ;
}
HttpResponse response = Unirest.get("https://api.brightdata.com/datasets/snapshots/{id}/download")
.header("Authorization", "Bearer ")
.asString() ;
nécessite 'uri'
requiert 'net/http'
url = URI("https://api.brightdata.com/datasets/snapshots/{id}/download")
http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true
request = Net::HTTP::Get.new(url)
request["Authorization"] = 'Bearer '
response = http.request(request)
puts response.read_body
Abonnement aux données
Abonnez-vous pour accéder aux ensembles de données à un coût considérablement réduit.
Formats de fichiers
JSON, NDJSON, JSON Lines, CSV, Parquet. Compression .gz optionnelle.
Livraison flexible
Snowflake, Amazon S3 bucket, Google Cloud, Azure y SFTP.
Des données évolutives
Évoluez sans vous soucier de l'infrastructure, des serveurs proxy ou du blocage.
Réduction des coûts
Personnalisez n'importe quel ensemble de données à l'aide de filtres et d'options de formatage.
Maintenance du code
Les ensembles de données sont mis à jour en fonction des modifications apportées à la structure du site web.
Intégrations simplifiées
Bénéficiez d'intégrations avec Snowflake et AWS.
Assistance 24/7
Une équipe spécialisée de professionnels des données est là pour vous aider.
Leaders en matière de conformité
Les données proviennent de sources éthiques et sont conformes à toutes les lois sur la protection de la vie privée.
Nous fournissons les données et vous vous occupez du reste
Gros volume de données Web
Grâce à nos capacités de déblocage et à la rotation permanente des adresses IP, nous garantissons l’accès à tous les points de données d’un site Web.
Données immédiatement exploitables
Chaque aspect du processus de collecte des données est soumis à un processus rigoureux de validation des données.
Flux de données automatisé
Planifiez la livraison automatique des données et voyez comment elles seront facilement acheminées vers votre espace de stockage.