Renforcez Vos Documents Google Drive avec Chat IA & RAG Qdrant
La recherche manuelle dans de grandes bibliothèques de documents pour trouver des réponses est chronophage et inefficace. Ce flux de travail crée un chatbot RAG alimenté par l'IA qui extrait instantanément des informations de vos documents Google Drive et fournit des réponses contextuelles utilisant Gemini AI et Qdrant.

Documentation
Chatbot RAG Alimenté par IA pour les Documents Google Drive
Ce flux de travail complet n8n transforme vos documents Google Drive statiques en une base de connaissances dynamique et interactive. Il simplifie l'ingestion des documents, extrait intelligemment les métadonnées, et permet un puissant chatbot RAG (génération augmentée par récupération) alimenté par Google Gemini et Qdrant pour des informations immédiates et contextualisées.
Caractéristiques Clés
- Ingestion Automatisée des Documents Google Drive : Importez facilement des documents depuis des dossiers Google Drive spécifiés pour leur traitement.
- Extraction de Métadonnées Améliorée par IA avec Gemini : Identifiez et extrayez automatiquement des métadonnées essentielles grâce à Google Gemini pour des capacités de recherche plus riches et précises.
- Intégration Robuste de la Base de Données Vectorielle Qdrant : Stockez et gérez en toute sécurité les embeddings de documents pour une recherche sémantique à haute performance.
- Génération Augmentée par Récupération (RAG) Intelligente : Fournissez des réponses très précises et contextuelles en récupérant des extraits de documents pertinents avant de générer des réponses.
- Suppression de Documents avec Intervention Humaine : Assurez l'intégrité des données grâce à une étape d'approbation basée sur Telegram pour la suppression des enregistrements de la base vectorielle.
- Journalisation Persistante de l'Historique des Discussions : Sauvegardez automatiquement toutes les interactions du chatbot dans un Google Doc pour les audits et références futures.
Comment Cela Fonctionne
Ce flux de travail fonctionne en deux phases principales : ingestion et stockage des documents dans une base vectorielle Qdrant, puis utilisation de cette base pour alimenter un chatbot RAG piloté par IA.
Phase 1 : Traitement et Stockage des Documents
Le flux de travail est initié soit manuellement soit via un webhook vers un dossier Google Drive spécifié. Il identifie tous les ID de fichiers dans le dossier et, après une approbation optionnelle humaine via Telegram pour la suppression des données existantes, télécharge chaque document. Le contenu des documents est ensuite extrait, et Google Gemini est utilisé pour extraire des métadonnées riches (comme les thèmes généraux, les sujets récurrents, les points sensibles, et les mots-clés). Le texte extrait est découpé en tailles gérables par un séparateur de tokens. Les embeddings OpenAI sont générés pour ces segments, lesquels sont ensuite enregistrés avec leurs métadonnées dans votre store vectoriel Qdrant. Une notification Telegram confirme la fin du processus d'insertion/upsert.
Phase 2 : Interaction par Chat IA
Lorsqu'un message de chat est reçu, le flux utilise un modèle de chat Google Gemini avec une mémoire tampon de fenêtre pour maintenir le contexte de la conversation. Un agent IA utilise alors un outil de base vectorielle Qdrant pour effectuer des recherches sémantiques, récupérant les segments de documents les plus pertinents en fonction de la requête de l'utilisateur et des métadonnées extraites. L'agent synthétise ces informations récupérées avec ses propres capacités pour générer des réponses précises et informatives. Enfin, toute l'interaction, incluant la saisie de l'utilisateur et la réponse de l'IA, est enregistrée dans un Google Doc désigné pour un suivi historique.