Automatiser l'extraction des transactions à partir de PDFs et d'images vers CSV
Extraire et catégoriser manuellement les transactions financières à partir de PDFs et d'images est un processus fastidieux et sujet aux erreurs. Ce workflow utilise l'IA pour extraire et catégoriser automatiquement les données des transactions, les convertissant en fichiers CSV organisés avec une précision et une rapidité remarquables.

Documentation
Automatiser l'extraction des données financières avec l'IA
Extraire manuellement les données de transactions à partir des relevés bancaires au format PDF ou image est une tâche longue et sujette aux erreurs. Ce workflow n8n propose une solution robuste pour traiter automatiquement ces documents, extraire les transactions financières pertinentes et les catégoriser dans un format CSV propre et structuré.
Fonctionnalités clés
- Ingestion automatisée des documents : Surveille un dossier Google Drive spécifié pour les nouveaux fichiers PDF et images, déclenchant instantanément le processus d'extraction.
- Routage intelligent des fichiers : Identifie automatiquement si un fichier reçu est un PDF ou une image et le dirige vers la chaîne de traitement d'IA appropriée.
- Extraction avancée du texte PDF : Utilise un modèle de langage puissant (Llama via OpenRouter) pour lire et analyser précisément des documents PDF complexes afin d’obtenir les détails des transactions.
- OCR d’image et compréhension avancées : Exploite Google Vertex AI (Gemini via LangChain) pour extraire du texte et comprendre les données transactionnelles à partir des relevés bancaires au format image.
- Catégorisation des transactions alimentée par IA : Assigne automatiquement des catégories pertinentes à chaque transaction, facilitant l'analyse financière et la budgétisation.
- Sortie CSV structurée : Convertit toutes les données extraites et catégorisées en un fichier CSV convivial, prêt à être importé dans des tableurs ou des logiciels comptables.
- Stockage cloud automatisé : Téléverse automatiquement les fichiers CSV finaux catégorisés dans un dossier Google Drive désigné.
Comment cela fonctionne
Ce workflow commence par la surveillance continue d'un dossier spécifique de Google Drive. Lorsqu'un nouveau fichier PDF ou image (comme un relevé bancaire) est téléchargé :
- 1. Détection et routage du fichier : Le nœud Obtenir PDF ou images détecte le nouveau fichier, et le nœud Routage selon PDF ou image détermine son type MIME.
- 2. Traitement du PDF : Si c'est un PDF, le nœud Télécharger PDF récupère le fichier. Le nœud Extraire les données du PDF extrait tout le contenu texte, qui est ensuite envoyé au nœud Envoyer les données à l'I.A. (OpenRouter). Un prompt sophistiqué demande à l'IA d'extraire toutes les transactions, de les catégoriser, et de retourner les données au format CSV.
- 3. Traitement de l’image : Si c'est une image, le nœud Télécharger Image la récupère. L'image est ensuite transmise au nœud Extraction de texte Vertex A.I. qui exploite le Modèle de chat Google Gemini (configuré avec Vertex AI) pour effectuer un OCR avancé, extraire et catégoriser les transactions sur la base d’un prompt détaillé.
- 4. Conversion en CSV : La sortie CSV de l’IA issue des deux chemins est ensuite standardisée et formatée par les nœuds Convertir en CSV ou Convertir en CSV2.
- 5. Téléversement dans Google Drive : Enfin, le fichier CSV catégorisé est téléversé automatiquement dans votre dossier "Exports CSV" désigné dans Google Drive, rendant vos données financières instantanément accessibles et organisées.