Verfolgen Sie die LLM-Nutzung & automatisieren Sie die Kundenabrechnung für KI-Dienste
Die manuelle Verfolgung der Nutzung von KI-Diensten und die Abrechnung der Kunden für LLM-Kosten sind komplex und zeitaufwendig. Dieser n8n-Workflow bietet ein umfassendes System, um KI-Dienste anzubieten, die LLM-Token-Nutzung und die damit verbundenen Kosten in Echtzeit sorgfältig zu verfolgen und die monatliche Kundenabrechnung zu automatisieren.

Documentation
KI-Dienst & automatisierte nutzungsbasierte Abrechnung
Dieser n8n-Workflow befähigt Unternehmen, KI-gestützte Dienste anzubieten und gleichzeitig eine präzise Kontrolle über den LLM-Verbrauch und die Abrechnung zu erhalten. Er bietet eine vollständige End-to-End-Lösung von der Dienstleistungserbringung für Kunden bis zur automatisierten monatlichen Rechnungsstellung auf Basis des tatsächlichen Tokenverbrauchs und der Kosten.
Hauptfunktionen
- Bieten Sie benutzerdefinierte KI-Dienste über ein benutzerfreundliches n8n-Formular an.
- Echtzeit-Tracking der LLM-Eingabe-, Ausgabe- und Gesamttoken-Nutzung pro Kunde.
- Exakte Berechnung der Kosten für KI-Dienste pro Anfrage.
- Automatisches Protokollieren von Nutzungsdaten in Google Sheets zur einfachen Dokumentation.
- Geplante monatliche Aggregation der Kundennutzungsdaten.
- Automatische Erstellung und Versand von nutzungsbasierten Rechnungen über Gmail.
Funktionsweise
Dieser Workflow ist in zwei Hauptteile unterteilt: die Bereitstellung eines KI-Dienstes und die Automatisierung seiner Abrechnung. Zunächst startet der Workflow mit einem n8n-Formular-Trigger, der es Kunden ermöglicht, Dokumente, wie Lebenslauf-PDFs, zum Verarbeiten hochzuladen. Der Parse PDF Upload-Knoten extrahiert Text aus diesen hochgeladenen Dateien. Gleichzeitig erfasst ein Set-Knoten essentielle Protokollierungsattribute wie Workflow-, Ausführungs- und Kunden-IDs zu Tracking-Zwecken.
Der Kern-KI-Dienst wird durch den Extract Resume Data-Knoten bereitgestellt, einen KI-gestützten Informationsextraktor, der ein LLM (im Beispiel OpenAI GPT-4o-mini) verwendet, um den extrahierten Text in ein strukturiertes JSON-Format zu parsen. Diese geparsten Daten werden anschließend dem Kunden über den Display JSON Document-Knoten präsentiert. Entscheidend ist, dass ein Custom LLM Subnode, der mit dem Langchain Code-Knoten erstellt wurde, die Antwort des LLM abfängt. Er extrahiert detaillierte Nutzungsmetadaten (Eingabe-/Ausgabetoken und deren Kosten) und protokolliert diese automatisch in einem bestimmten Google Sheet (Client Usage Log) über ein angehängtes Google Sheets-Werkzeug.
Für die Abrechnung initiiert ein Every End of Month trigger den Rechnungsprozess. Der Workflow ruft die Nutzungsprotokolle für einen bestimmten Kunden aus Google Sheets ab, filtert sie für den aktuellen Abrechnungszeitraum mit dem Knoten Filter Last Month und berechnet dann die Gesamtwerte für Tokens und Kosten im Knoten Calculates Totals. Schließlich wird automatisch eine Rechnung inklusive Steuern erstellt und dem Kunden über Gmail zugeschickt.