Automatizar la extracción de texto de PDF e imagen a CSV categorizado con IA
Extraer y categorizar manualmente datos de documentos diversos como estados bancarios, ya sean PDFs o imágenes, suele ser un proceso que consume mucho tiempo y es propenso a errores. Este flujo de trabajo automatiza todo el proceso, aprovechando potentes modelos de IA como Vertex AI (Gemini) y Llama 3.1 a través de OpenRouter para extraer texto con precisión, categorizar transacciones y generar archivos CSV estructurados, eliminando la necesidad de entrada manual de datos.

Documentation
Automatizar la extracción de texto de PDF e imagen a CSV categorizado
Extraer y categorizar manualmente datos de PDFs e imágenes, como estados bancarios, es un proceso tedioso y propenso a errores. Este flujo de trabajo aprovecha Vertex AI y otros LLM para extraer texto automáticamente, categorizar transacciones y generar un archivo CSV estructurado, eliminando la entrada manual de datos.
Características clave
- Monitorea automáticamente Google Drive para nuevos archivos PDF e imagen.
- Redirige inteligentemente archivos según tipo (PDF o imagen) para procesamiento especializado.
- Utiliza OCR avanzado para una extracción precisa de texto de documentos PDF.
- Utiliza Vertex AI (Gemini) para un reconocimiento robusto de texto y extracción de datos de imágenes.
- Aplica Modelos de Lenguaje de Gran Tamaño (LLMs) vía OpenRouter para categorizar datos extraídos, como transacciones financieras.
- Convierte automáticamente los datos extraídos y categorizados a formato CSV.
- Sube los archivos CSV categorizados finales directamente a una carpeta designada en Google Drive.
Cómo funciona
Este flujo de trabajo comienza monitoreando una carpeta específica de Google Drive para nuevos archivos PDF o imagen. Al detectarlos, determina inteligentemente el tipo de archivo. Si se carga un PDF, el flujo lo descarga, extrae el texto mediante un proceso OCR y envía este texto sin procesar a un LLM externo (Llama 3.1 vía OpenRouter) para extraer datos estructurados de transacciones y asignar categorías. Si se carga una imagen, se descarga y envía a Vertex AI (Gemini) para extracción directa de texto, análisis de transacciones y categorización. Ambas rutas convierten luego los datos procesados en un archivo CSV y lo suben a una carpeta de salida designada en Google Drive, proporcionando una canalización de datos totalmente automatizada desde la ingestión del documento hasta la exportación categorizada.