Automatisieren Sie die Transaktionsauswertung von PDFs & Bildern in CSV
Das manuelle Extrahieren und Kategorisieren von Finanztransaktionen aus PDFs und Bildern ist ein mühsamer und fehleranfälliger Prozess. Dieser Workflow nutzt KI, um Transaktionsdaten automatisch zu extrahieren und zu kategorisieren und sie mit bemerkenswerter Genauigkeit und Geschwindigkeit in organisierte CSV-Dateien zu konvertieren.

Documentation
Automatisieren Sie die Extraktion von Finanzdaten mit KI
Das manuelle Extrahieren von Transaktionsdaten aus Kontoauszügen im PDF- oder Bildformat ist eine zeitaufwändige und fehleranfällige Aufgabe. Dieser n8n-Workflow bietet eine robuste Lösung, um diese Dokumente automatisch zu verarbeiten, relevante Finanztransaktionen zu extrahieren und sie in ein sauberes, strukturiertes CSV-Format zu kategorisieren.
Hauptmerkmale
- Automatisierte Dokumentenerfassung: Überwacht einen festgelegten Google Drive-Ordner auf neue PDF- und Bilddateien und löst den Extraktionsprozess sofort aus.
- Intelligente Dateirouting: Erkennt automatisch, ob eine eingehende Datei eine PDF oder ein Bild ist, und leitet sie an die entsprechende KI-Verarbeitungspipeline weiter.
- Fortgeschrittene PDF-Text-Extraktion: Nutzt ein leistungsstarkes Sprachmodell (Llama über OpenRouter), um komplexe PDF-Dokumente für Transaktionsdetails genau zu lesen und zu analysieren.
- Fortschrittliche Bild-OCR & Verständnis: Verwendet Google Vertex AI (Gemini via LangChain), um Text zu extrahieren und transaktionale Daten aus bildbasierten Kontoauszügen zu verstehen.
- KI-gestützte Transaktionskategorisierung: Ordnet automatisch relevante Kategorien zu jeder Transaktion zu, was die Finanzanalyse und Budgetierung erleichtert.
- Strukturierte CSV-Ausgabe: Konvertiert alle extrahierten und kategorisierten Daten in eine benutzerfreundliche CSV-Datei, bereit für den Import in Tabellenkalkulations- oder Buchhaltungssoftware.
- Automatisierte Cloud-Speicherung: Lädt die finalen kategorisierten CSV-Dateien direkt zurück in einen bestimmten Google Drive-Ordner hoch.
Funktionsweise
Dieser Workflow beginnt mit der kontinuierlichen Überwachung eines bestimmten Google Drive-Ordners. Wenn eine neue PDF- oder Bilddatei (z. B. ein Kontoauszug) hochgeladen wird:
- 1. Dateierkennung & Routing: Der Get PDF or Images-Knoten erkennt die neue Datei, und der Route based on PDF or Image-Knoten bestimmt ihren MIME-Typ.
- 2. PDF-Verarbeitungspfad: Ist es eine PDF, ruft der Download PDF-Knoten die Datei ab. Der Extract data from PDF-Knoten extrahiert sämtlichen Textinhalt, der anschließend an den Send data to A.I. (OpenRouter)-Knoten gesendet wird. Ein ausgeklügelter Prompt weist die KI an, alle Transaktionen zu extrahieren, zu kategorisieren und die Daten als CSV zurückzugeben.
- 3. Bildverarbeitungspfad: Handelt es sich um ein Bild, ruft der Download Image-Knoten es ab. Das Bild wird dann an den Vertex A.I. extract text-Knoten übergeben, der das Google Gemini Chat Model (konfiguriert mit Vertex AI) verwendet, um eine fortschrittliche OCR durchzuführen sowie Transaktionen anhand eines detaillierten Prompts zu extrahieren und zu kategorisieren.
- 4. CSV-Konvertierung: Die CSV-Ausgabe der KI aus beiden Pfaden wird anschließend standardisiert und vom Convert to CSV- oder Convert to CSV2-Knoten formatiert.
- 5. Google Drive Upload: Schließlich wird die kategorisierte CSV-Datei automatisch in Ihren festgelegten "CSV Exports"-Ordner in Google Drive hochgeladen, sodass Ihre Finanzdaten sofort zugänglich und organisiert sind.