Jeux de données CNN
Donnez à votre entreprise les moyens de prendre des décisions éclairées, de cibler des groupes démographiques précis et de stimuler la croissance stratégique en utilisant un ensemble de données CNN
- 13+ points de données disponibles
- Accédez aux principaux points de données des sites d'actualités de CNN
- Des données CNN précises à portée de main
Approuvé par 20,000+ clients dans le monde
L'ensemble de données de CNN News est une collection complète d'articles d'actualité, chacun étant identifié de manière unique par un ID. Cet ensemble de données comprend des métadonnées essentielles telles que l'URL de l'article, l'auteur qui l'a écrit et le titre qui capture l'essence de l'histoire.
Datasets Pricing
- Propre et validé
- Mise à jour mensuelle
- JSON/CSV/Parquet
Des agents d'intelligence artificielle instantanément performants
Nos ensembles de données CNN sont optimisés pour l'IA/LLM : clairement structurés, bien documentés, avec du code et des recettes pour une intégration facile du LLM/chatbot. recettes pour une intégration facile de LLM/chatbot.
Structuré et propre
Des données prétraitées avec des schémas cohérents, parfaites pour la formation et l'inférence de modèles d'IA.
Exemples de codes
Des snippets Python, Node.js, cURL, PHP, Go, Java et Ruby prêts à l'emploi pour une intégration aisée dans les flux de travail de l'IA.
Documentation
curl --request GET
--url https://api.brightdata.com/datasets/snapshots/{id}/download
--header 'Authorization : Bearer '
import requêtes
url = "https://api.brightdata.com/datasets/snapshots/{id}/download"
headers = {"Authorization" : "Bearer "}
response = requests.get(url, headers=headers)
print(response.json())
const url = 'https://api.brightdata.com/datasets/snapshots/{id}/download' ;
const options = {method : 'GET', headers : {Authorization : 'Bearer '}, body : undefined} ;
try {
const response = await fetch(url, options) ;
const data = await response.json() ;
console.log(data) ;
} catch (error) {
console.error(error) ;
}
HttpResponse response = Unirest.get("https://api.brightdata.com/datasets/snapshots/{id}/download")
.header("Authorization", "Bearer ")
.asString() ;
nécessite 'uri'
requiert 'net/http'
url = URI("https://api.brightdata.com/datasets/snapshots/{id}/download")
http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true
request = Net::HTTP::Get.new(url)
request["Authorization"] = 'Bearer '
response = http.request(request)
puts response.read_body
Abonnement aux données
Abonnez-vous pour accéder aux ensembles de données à un coût considérablement réduit.
Formats de fichiers
JSON, NDJSON, JSON Lines, CSV, Parquet. Compression .gz optionnelle.
Livraison flexible
Snowflake, Amazon S3 bucket, Google Cloud, Azure y SFTP.
Des données évolutives
Évoluez sans vous soucier de l'infrastructure, des serveurs proxy ou du blocage.
Réduction des coûts
Personnalisez n'importe quel ensemble de données à l'aide de filtres et d'options de formatage.
Maintenance du code
Les ensembles de données sont mis à jour en fonction des modifications apportées à la structure du site web.
Intégrations simplifiées
Bénéficiez d'intégrations avec Snowflake et AWS.
Assistance 24/7
Une équipe spécialisée de professionnels des données est là pour vous aider.
Leaders en matière de conformité
Les données proviennent de sources éthiques et sont conformes à toutes les lois sur la protection de la vie privée.
Nous fournissons les données et vous vous occupez du reste
Gros volume de données Web
Grâce à nos capacités de déblocage et à la rotation permanente des adresses IP, nous garantissons l’accès à tous les points de données d’un site Web.
Données immédiatement exploitables
Chaque aspect du processus de collecte des données est soumis à un processus rigoureux de validation des données.
Flux de données automatisé
Planifiez la livraison automatique des données et voyez comment elles seront facilement acheminées vers votre espace de stockage.
Comment les entreprises utilisent-elles les ensembles de données CNN ?
Analyse des médias
Études de transparence
Parmi les points de données, citons : ID, URL, auteur, titre, sujets, date de publication, dernière mise à jour, contenu, vidéos, images, articles connexes, etc.
Les jeux de données sont disponibles aux formats JSON, NDJSON, JSON Lines, CSV et Parquet. Il est aussi possible de recevoir les fichiers compressés en .gz.
Puis-je obtenir un échantillon de données ?
Oui, vous pouvez demander un échantillon de données pour évaluer la qualité et la pertinence des informations fournies. Ainsi, vous pourrez vous assurer que les données répondent à vos besoins avant que vous n’achetiez le jeu complet de données.