Blog / AI
AI

Utiliser Dify pour créer des agents d’intelligence artificielle capables de récupérer des données

Apprenez à construire des agents d’intelligence artificielle avec Dify et Bright Data pour une extraction précise des données web dans ce tutoriel simple !
5 min de lecture
Building AI agents with Dify

Dans ce tutoriel, vous apprendrez :

  • Ce qu’est Dify et pourquoi c’est un outil intéressant pour construire des agents d’intelligence artificielle.
  • Pourquoi les agents d’IA doivent avoir accès à des données web fraîches et précises pour fournir des résultats fiables.
  • Comment créer un agent d’intelligence artificielle doté de capacités d’extraction de données à l’aide d’un flux de travail Dify sans code.

Plongeons dans l’aventure !

Qu’est-ce que Dify ?

Dify est une plateforme open-source de plus en plus populaire pour la création d’applications d’IA générative avec des LLM. Elle simplifie le processus de développement en offrant une interface visuelle sans code/à faible code pour créer des flux de travail d’IA et des pipelines RAG.

Le diagramme de croissance en étoile de GitHub pour Dify

Vous pouvez tirer parti de Dify via sa version open-source auto-hébergée ou l’utiliser directement dans le nuage sans aucune configuration (comme nous le ferons ici). Essentiellement, il agit comme un BaaS(Backend-as-a-Service) pour les opérations LLM.

Dify prend en charge une large gamme de LLM et offre des capacités d’intégration étendues grâce à plusieurs plugins. Ceux-ci permettent d’établir des connexions avec divers services et solutions tiers. À l’heure où nous écrivons ces lignes, sa place de marché propose une centaine de plugins et d’extensions.

Les agents d’IA doivent être précis et efficaces

Quelle que soit la plateforme, la bibliothèque ou l’outil de construction d’agents d’IA que vous choisissez, il existe une limitation majeure : pour être précis, les agents d’IA ont besoin de données de haute qualité. À cet égard, n’oubliez pas que le web est l’une des sources de données les plus riches et les plus fiables.

Ainsi, pour être vraiment efficace, un agent d’IA doit être capable d’accéder aux pages web et d’en extraire des données directement. Mais il ne suffit pas d’extraire du contenu brut. Les données doivent être optimisées pour une utilisation par l’IA, idéalement au format Markdown.

Astuce: le format Markdown est compact et plus facile à traiter par les modèles d’intelligence artificielle, ce qui se traduit souvent par des résultats plus précis, comme le confirment nos analyses comparatives.

C’est pourquoi vos agents Dify AI ont besoin d’un plugin capable d’extraire un contenu structuré tel que Markdown à partir de n’importe quelle page Web. C’est précisément ce que propose le plugin Bright Data Dify. En outre, il permet à votre agent d’IA sans code d’extraire des données fraîches à partir de moteurs de recherche et de plus de 50 plateformes populaires dans un format JSON structuré.

Le plugin Bright Data gère pour vous tous les défis du scraping web, y compris les CAPTCHA, les blocages d’IP, les limites de taux, et bien plus encore. Ensuite, grâce au constructeur de flux sans code de Dify, vous pouvez tout intégrer dans votre agent d’IA en connectant simplement des nœuds. Le résultat est un agent d’IA prêt pour la production, avec un accès à des données Web fiables et en temps réel.

Comment intégrer le plugin Bright Data dans Dify pour la création d’agents d’intelligence artificielle ?

Dans cette section guidée, vous apprendrez à construire un agent d’IA dans Dify. En particulier, vous utiliserez le plugin Bright Data comme moteur de données prêt pour l’IA qui alimente l’agent avec des informations fiables.

Nous allons construire un agent de résumé simple qui peut résumer le contenu de n’importe quelle page Web. Notez qu’il ne s’agit que d’un exemple pour démontrer ce qu’il est possible de faire avec l’intégration Dify + Bright Data. Vous pouvez couvrir de nombreux autres cas d’utilisation tout aussi facilement.

Remarque: d’une certaine manière, l’exemple choisi peut être considéré comme un flux de travail agentique RAG. En effet, le plugin Bright Data peut être considéré comme le composant de recherche dans le processus agentique RAG.

Suivez les étapes ci-dessous pour créer un agent IA sans code dans Dify qui accède à des données web actualisées !

Conditions préalables

Pour reproduire ce tutoriel et construire un agent d’intelligence artificielle dans Dify powered by Bright Data, vous avez besoin des éléments suivants :

Si vous ne les avez pas encore, cliquez sur les liens ci-dessus et suivez les instructions d’installation.

Étape n° 1 : Intégration du programme LLM

Note : Si vous avez déjà une intégration LLM dans votre compte Dify, vous pouvez sauter cette étape.

Pour créer un agent d’IA dans Dify, vous devez d’abord configurer un fournisseur LLM. Pour ce faire, connectez-vous à Dify et accédez à votre tableau de bord. Cliquez sur votre image de profil dans le coin supérieur droit et sélectionnez l’option “Paramètres” :

Sélection de l'option "Réglages

Ensuite, dans la barre latérale de la fenêtre modale, cliquez sur l’option “Model Provider”. Ici, vous pouvez installer le fournisseur LLM que vous souhaitez utiliser. Dans ce tutoriel, nous nous appuierons sur Gemini (dont l’utilisation est gratuite via l’API) :

Sélection de Gemini comme fournisseur du modèle Dify

Survolez l’option Gemini et cliquez sur le bouton “Installer”. Une fois installé, cliquez sur le bouton “Setup” et collez votre clé API Gemini pour terminer la configuration :

Coller la clé API Gemini

Ensuite, cliquez sur “System Model Settings” pour définir Gemini comme fournisseur global de LLM dans votre compte Dify :

Paramètres du modèle de système

Choisissez le modèle que vous souhaitez utiliser. Dans ce cas, nous choisirons “Gemini 2.0 Flash” (qui est gratuit via l’API). Cliquez ensuite sur “Enregistrer” :

Sélection du modèle LLM

C’est parfait ! L’intégration de votre LLM dans Dify est maintenant terminée.

Étape 2 : Installation du plugin Bright Data

Il est temps d’installer le plugin Bright Data Dify. Pour ce faire, cliquez sur l’option “PLUGINS” située dans la barre latérale à gauche de votre image de profil :

Cliquer sur l'option "PLUGINS

Dans la section Dify Plugin Marketplace, cliquez sur le bouton “Install Plugin”, puis choisissez l’option “GitHub” :

Sélectionner le bouton d'installation "GitHub

Dans la fenêtre modale qui s’affiche, collez l’URL GitHub du plugin Bright Data Dify :

https://github.com/Idanvilenski/BrightData_Dify_Plugin
Définition de l'URL GitHub pour le plugin Bright Data Dify

Sélectionnez la version du plugin (la plus récente est recommandée), choisissez le package du plugin et cliquez sur “Suivant” :

Installation du plugin Bright Data Dify via GitHub

Cliquez sur “Install” pour finaliser l’installation du plugin. Une fois l’installation terminée, cliquez sur la carte du plugin. Dans le panneau qui s’ouvre à droite, cliquez sur le bouton “Authorize” :

Cliquez sur Autoriser

Collez votre clé API Bright Data, puis cliquez sur “Enregistrer” :

Enregistrement de la clé API de Bright Data

Génial ! Le plugin Bright Data Dify est maintenant installé et ses outils sont prêts à être utilisés.

Étape 3 : Créer une nouvelle application Dify

Vous avez maintenant tout ce qu’il faut pour créer votre agent de synthèse d’IA sans code. Retournez sur votre tableau de bord Dify et cliquez sur “CREATE APP > Create from Blank” pour démarrer un nouveau projet d’agent d’IA :

Cliquer sur l'option "Create from Blank" (Créer à partir d'un fichier vierge)

Sélectionnez le modèle “Workflow”, nommez votre agent AI quelque chose comme “AI Summarization Agent”, puis cliquez sur “Create” pour initialiser l’application :

Initialisation de votre nouvel agent d'IA dans Dify

Vous verrez le canevas visuel où vous pouvez construire votre agent en connectant des nœuds :

Le canevas pour créer votre logique d'agent d'IA sans code

C’est ici que vous définirez la logique et le flux de données de votre agent d’IA en reliant différents composants entre eux. Fantastique !

Étape 4 : Élaborer la logique de l’agent d’IA

Avant de mettre en œuvre votre agent d’intelligence artificielle sans code, prenez le temps de définir ce que l’agent d’intelligence artificielle doit faire. Dans le cas présent, l’agent d’intelligence artificielle doit

  1. Recevoir l’URL de la page web à résumer.
  2. Transmettre l’URL au plugin Bright Data pour récupérer le contenu de sa page au format Markdown.
  3. Envoyer le contenu Markdown au LLM configuré avec une invitation à générer un résumé.
  4. Renvoyer le contenu résumé à l’utilisateur.

Dans les quatre étapes suivantes, vous mettrez en œuvre chacune de ces actions en connectant des nœuds et en utilisant des plugins dans Dify.

Étape 5 : Configuration du paramètre d’entrée de l’URL de la page

Tout d’abord, cliquez sur le nœud “START”, puis sur l’icône “+” pour ajouter une nouvelle variable d’entrée :

Cliquer sur le bouton "+".

Dans les options de type d’entrée, sélectionnez le type de données “Paragraphe”. Ce type de données est idéal pour saisir du texte tel qu’une URL. Nommez l’entrée quelque chose comme page_url :

Définition de l'entrée page_url "Paragraphe

Assurez-vous que l’option “Required” est activée, car cette entrée est essentielle au fonctionnement de l’agent d’intelligence artificielle. Après avoir sauvegardé, vous verrez quelque chose comme ceci :

Notez le paramètre d'entrée page_url configuré

Voyez comment le nœud “START” affiche maintenant votre variable d’entrée personnalisée. Bravo pour votre travail !

Étape 6 : Récupérer le contenu Markdown avec le plugin Bright Data

Cliquez sur le bouton “+” du nœud “START” et sélectionnez le plugin Bright Data. Choisissez ensuite l’outil “Scrape As Markdown” :

Choisir l'outil "Scrape As Markdown".

Configurez l’outil en définissant page_url comme paramètre d’entrée. Activez également l’option “RETRY ON FAILURE”. Cela permet au plugin Bright Data de réessayer automatiquement si une erreur se produit au cours du processus d’extraction :

Configuration de l'outil "SCRAPE AS MARKDOWN" à partir du plugin Bright Data

Merveilleux ! Le plugin Bright Data va maintenant prendre l’URL fournie, récupérer la page et renvoyer son contenu au format Markdown.

Étape 7 : Intégrer la logique de résumé LLM

L’étape suivante consiste à connecter un nœud LLM qui résumera le contenu Markdown renvoyé par le plugin Bright Data. Cliquez sur l’icône “+” du nœud “Scrape As Markdown” et sélectionnez “LLM” :

Sélection du nœud LLM

Dans les paramètres du nœud “LLM”, réglez l’entrée “CONTEXT” sur la variable texte, qui est la sortie de l’outil “Scrape As Markdown”.

Ensuite, écrivez une invite comme la suivante :

You are a summarization agent. Based on the Markdown content provided below, write a concise and helpful summary in no more than 150 words. Focus on capturing the key elements of the content.

Content:
{CONTEXT}
Ajout de l'invite avec le contexte

Le nœud “LLM” agit comme le cerveau de votre agent Dify AI, en traitant les données et en générant le résumé. C’est formidable ! Vous avez presque terminé la logique de construction de l’agent d’IA.

Étape n° 8 : Renvoyer le résumé

La dernière étape de votre flux de travail sans code de l’agent Dify AI consiste à ajouter un nœud “Fin” :

Sélection d'un nœud "final

Configurer le nœud “END” pour qu’il utilise la sortie texte du nœud LLM :

Définition de la variable de sortie "text

Ce nœud se chargera de renvoyer le contenu final résumé à l’utilisateur. Mission terminée ! Votre agent de résumé d’IA sans code est prêt à l’emploi.

Étape n° 9 : Testez votre agent d’intelligence artificielle

Voici à quoi devrait ressembler le flux de travail de l’agent Dify AI une fois terminé :

Le flux de travail final de l'agent Dify AI

Avec seulement quatre nœuds, vous avez construit un agent d’IA du monde réel doté de capacités de synthèse précises.

Pour le tester, cliquez sur le bouton “Exécuter” dans le coin supérieur droit :

Cliquer sur le bouton "Exécuter

Ensuite, entrez l’URL de la page que vous souhaitez résumer. Pour cet exemple, vous devez utiliser un article de CNN Sports.

Appuyez sur le bouton “Start Run” et vous verrez chaque nœud s’exécuter dans l’ordre, devenant vert pour indiquer le succès :

L'exécution de l'agent IA

Il s’agit d’un résultat possible :

This CNN article analyzes the epic French Open final between Carlos Alcaraz and Jannik Sinner, highlighting it as proof that men's tennis is in good hands for the future. Alcaraz's improbable comeback from two sets down against Sinner is described as a historic moment. The author notes that with the era of Djokovic, Federer, and Nadal ending, Alcaraz and Sinner have demonstrated that they are ready to fill the void. The rivalry between Alcaraz and Sinner is compared to the great rivalries of the past, with the potential to elevate the sport. Experts even suggest that Alcaraz and Sinner could beat Nadal at his best. The article emphasizes the high level of play and the exciting future of tennis with these two stars.

Il s’agit d’un résumé concis et contextuel de moins de 150 mots, comme demandé. Remarquez que le LLM a également reconnu la source de l’article comme étant CNN.

Et voilà ! Vous venez de construire un agent de synthèse IA entièrement fonctionnel dans Dify, sans écrire une seule ligne de code. Cet agent est capable de traiter et de résumer n’importe quelle page web.

Conclusion

Dans cet article, vous avez appris à utiliser Dify pour créer un agent de synthèse IA avec un flux de travail sans code. Pour être prêt pour la production, l’agent doit avoir accès à des données web publiques. Cela est possible grâce au plugin Bright Data Dify, qui expose des outils avancés pour la récupération de données prêtes pour l’IA.

Il ne s’agit là que d’un simple exemple de flux de travail, mais il se peut que vous souhaitiez créer des agents d’intelligence artificielle plus complexes. Pour ce faire, vous avez besoin d’outils pour récupérer, valider et transformer le contenu Web. C’est exactement ce que l ‘infrastructure d’IA de Bright Data est conçue pour fournir.

Créez un compte Bright Data gratuit et commencez à expérimenter nos outils de données prêts pour l’IA !