Jeux de données CNN

Donnez à votre entreprise les moyens de prendre des décisions éclairées, de cibler des groupes démographiques précis et de stimuler la croissance stratégique en utilisant un ensemble de données CNN

  • 13+ points de données disponibles
  • Accédez aux principaux points de données des sites d'actualités de CNN
  • Des données CNN précises à portée de main
CNN datasets hero image
TRUSTED BY 20,000+ CUSTOMERS WORLDWIDE

L'ensemble de données de CNN News est une collection complète d'articles d'actualité, chacun étant identifié de manière unique par un ID. Cet ensemble de données comprend des métadonnées essentielles telles que l'URL de l'article, l'auteur qui l'a écrit et le titre qui capture l'essence de l'histoire.

Datasets Pricing

Taux de rafraîchissement
100K
500K
1M
5M
20M
Ensemble de données complet
3TB
  • Propre et validé
  • Mise à jour mensuelle
  • JSON/CSV/Parquet

Des agents d'intelligence artificielle instantanément performants

Nos ensembles de données CNN sont optimisés pour l'IA/LLM : clairement structurés, bien documentés, avec du code et des recettes pour une intégration facile du LLM/chatbot.
recettes pour une intégration facile de LLM/chatbot.

structured data

Structuré et propre

Des données prétraitées avec des schémas cohérents, parfaites pour la formation et l'inférence de modèles d'IA.

code examples

Exemples de codes

Des snippets Python, Node.js, cURL, PHP, Go, Java et Ruby prêts à l'emploi pour une intégration aisée dans les flux de travail de l'IA.

documentation

Documentation

Guides et carnets de notes complets pour ChatGPT, Claude et d'autres intégrations LLM.
                              curl --request GET 
--url https://api.brightdata.com/datasets/snapshots/{id}/download 
--header 'Authorization : Bearer '
                              
                            
                              import requêtes
url = "https://api.brightdata.com/datasets/snapshots/{id}/download"
headers = {"Authorization" : "Bearer "}
response = requests.get(url, headers=headers)
print(response.json())
                              
                            
                              const url = 'https://api.brightdata.com/datasets/snapshots/{id}/download' ;
const options = {method : 'GET', headers : {Authorization : 'Bearer '}, body : undefined} ;

try {
const response = await fetch(url, options) ;
const data = await response.json() ;
console.log(data) ;
} catch (error) {
console.error(error) ;
}
                              
                            
                              HttpResponse response = Unirest.get("https://api.brightdata.com/datasets/snapshots/{id}/download")
.header("Authorization", "Bearer ")
.asString() ;
                              
                            
                              nécessite 'uri'
requiert 'net/http'

url = URI("https://api.brightdata.com/datasets/snapshots/{id}/download")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Get.new(url)
request["Authorization"] = 'Bearer '

response = http.request(request)
puts response.read_body
                              
                            
Obtenez des jeux de données faciles à utiliser et bien structurés pour n’importe quel cas d’utilisation
dataset subscription

Abonnement aux données

Abonnez-vous pour accéder aux ensembles de données à un coût considérablement réduit.

file outputs

Formats de fichiers

JSON, NDJSON, JSON Lines, CSV, Parquet. Compression .gz optionnelle.

flexible delivery

Livraison flexible

Snowflake, Amazon S3 bucket, Google Cloud, Azure y SFTP.

enriched datasets

Des données évolutives

Évoluez sans vous soucier de l'infrastructure, des serveurs proxy ou du blocage.

discounts

Réduction des coûts

Personnalisez n'importe quel ensemble de données à l'aide de filtres et d'options de formatage.

code maintanence

Maintenance du code

Les ensembles de données sont mis à jour en fonction des modifications apportées à la structure du site web.

api integrations

Intégrations simplifiées

Bénéficiez d'intégrations avec Snowflake et AWS.

support

Assistance 24/7

Une équipe spécialisée de professionnels des données est là pour vous aider.

compliance

Leaders en matière de conformité

Les données proviennent de sources éthiques et sont conformes à toutes les lois sur la protection de la vie privée.

Nous fournissons les données et vous vous occupez du reste

Gros volume de données Web

Grâce à nos capacités de déblocage et à la rotation permanente des adresses IP, nous garantissons l’accès à tous les points de données d’un site Web.

Données immédiatement exploitables

Chaque aspect du processus de collecte des données est soumis à un processus rigoureux de validation des données.

Flux de données automatisé

Planifiez la livraison automatique des données et voyez comment elles seront facilement acheminées vers votre espace de stockage.

Comment les entreprises utilisent-elles les ensembles de données CNN ?

Utiliser les ensembles de données CNN sur les sources des articles de presse et les résultats de la vérification des faits pour vérifier l'authenticité du contenu des nouvelles. Les journalistes, les chercheurs et les organismes de vérification des faits peuvent analyser ces données afin d'identifier la désinformation et de fournir des informations exactes au public. Cela est essentiel pour maintenir une société informée et lutter contre la propagation des fausses nouvelles.
Acheter maintenant
government_and_law_enforcement

Analyse des médias

Explorez les transcriptions d'émissions et les grilles de programmes de CNN pour une analyse approfondie des médias. Les universitaires, les analystes des médias et les étudiants peuvent étudier le contenu pour comprendre le cadrage des informations, la fréquence des sujets traités et la diversité des points de vue présentés. Les données peuvent être utilisées pour la recherche universitaire, la critique des médias et la compréhension des orientations éditoriales des médias.
Acheter maintenant
segment_your_audience

Études de transparence

Évaluer l'intégrité et la transparence journalistiques à l'aide des ensembles de données de CNN. La recherche, les organismes de surveillance des médias et les groupes de défense peuvent évaluer les pratiques de reportage, le respect des normes journalistiques et la transparence des corrections et des rétractations. L'analyse peut contribuer aux études sur le journalisme et la responsabilité des médias.
Acheter maintenant
journalistic_integrity

Parmi les points de données, citons : ID, URL, auteur, titre, sujets, date de publication, dernière mise à jour, contenu, vidéos, images, articles connexes, etc.

L’achat d’un sous-jeu permet de réduire considérablement les coûts.

Les jeux de données sont disponibles aux formats JSON, NDJSON, JSON Lines, CSV et Parquet. Il est aussi possible de recevoir les fichiers compressés en .gz.

Oui, vous pouvez demander un échantillon de données pour évaluer la qualité et la pertinence des informations fournies. Ainsi, vous pourrez vous assurer que les données répondent à vos besoins avant que vous n’achetiez le jeu complet de données.