Aplicaciones en este flujo de trabajo

Cómo funciona

¡Construye tu extractor automatizado de pdf a texto en un minuto! La solución perfecta para quienes trabajan con grandes cantidades de CV u otros documentos. ¡Extrae datos de documentos mediante un flujo de trabajo remoto en Latenode.com!


En este artículo verás cómo crear un flujo de trabajo automatizado sin código que extraerá datos de los archivos PDF de tu Google Drive utilizando la API y el Chat GPT, y rellenando el formulario de Google Sheet con los datos.

Además, ¡puedes conseguir gratis la plantilla de ese escenario que puedes copiar y utilizar para ti! 

Puedes actualizar esta plantilla o utilizarla no sólo para extraer texto de pdf.

Resumen del escenario

Veamos primero todo el escenario del pdf scraper, y luego desglosemos cada paso.

Ilustración de la visión general del Escenario en Latenode

¿Cómo funciona este escenario de extracción de pdf? Una vez cada hora, coge todos los CV en formato pdf de Google Drive, conviértelos a archivos txt mediante una petición HTTP y, a continuación, el asistente chatGPT extrae los datos necesarios y rellena la hoja de cálculo de Google.

Pasos principales del escenario:

  1. Activador programado. Activa el escenario en un periodo de tiempo determinado.
  2. Google Drive. Aquí tenemos 2 nodos: Buscar archivo y Descargar archivo.
  3. Javascript. Utilizaremos nodos Javascript con el copiloto AI para dar formato a los archivos en todo el escenario. En primer lugar, pedí a AI que me diera un código que convirtiera los archivos de Google Drive al formato base64.
  4. Solicitud HTTP. Utiliza la API para extraer texto de un pdf utilizando los documentos de la API de servicios de terceros probados.
  5. ChatGPT. El asistente ChatGPT extrae los datos del texto.
  6. Hojas de cálculo de Google. Rellena la hoja con esa información,

Desglose del escenario

Y aquí tienes unas instrucciones paso a paso para los que quieran aprender el proceso. Recuerda que al final del artículo encontrarás plantillas gratuitas y listas para usar.

Preparativos

Para este escenario, necesitarás tener la capacidad de utilizar Asistentes de IA Abiertos y cualquier convertidor de API.

Asistente OpenAI

Es muy sencillo. Entra en tu cuenta de OpenAI, luego ve a asistentesy haz clic en el botón "crear" de la esquina superior derecha. Verás el panel de configuración del asistente.

Ilustración de los ajustes correctos del asistente de IA

Aquí tienes que hacerlo:

  1. Dale un nombre a tu asistente
  2. Dale instrucciones sobre cómo quieres que responda, y algo de contexto. Te recomendamos que le pidas que utilice archivos adjuntos, porque si no, puede olvidarse de hacerlo.
  3. Elige un modelo
  4. Selecciona las herramientas disponibles y añade archivos que el asistente pueda utilizar. No olvides activar la recuperación para que sea posible añadir archivos.

Copia el ID del asistente (lo verás bajo la columna Nombre), y luego ve a Claves APIcrea una y guárdala.

Conversor de PDF a TXT

Utiliza el que quieras. Yo utilicé ConvertAPI porque tiene una versión de prueba gratuita y proporciona mucha información.

Ilustración de la aplicación ConvertAPI para crear un conversor automático de pdf a texto

Crear escenario

Ahora cambiamos a Latenode.com. Aquí, tenemos que crear el escenario de conversión de pdf a texto: (No necesitas crearlo desde cero, simplemente copia la plantilla que hay al final del artículo)

Activador de programación

Ilustración del activador de horario

Haz clic en "Añadir nodo" en la pestaña de escenario, elige "Programar" en la lista. Haz clic en el nodo para configurarlo. Especifica el intervalo y la zona horaria, guarda los cambios. También he añadido un activador en Ejecutar una vez, sólo por comodidad.

Nodos de Google Drive

Ilustración de los nodos de Google Drive

Haz clic en "Añadir nodo", busca la carpeta Google drive en la pestaña de acciones y elige el nodo "Buscar archivo".
Para que funcione, tienes que iniciar sesión en la cuenta de gmail para obtener el token de acceso, elegir la unidad y el nombre de búsqueda. En este caso, quiero extraer datos de archivos que tengan CV en su nombre.

A continuación, añade "Descargar archivo" desde la misma carpeta de acciones de Google drive.

Ilustración cómo descargar el archivo que necesitas para crear el conversor AI pdf-texto

Utiliza el id de los resultados del nodo anterior, y luego haz clic en ejecutar nodo una vez para guardar los cambios y hacer que los datos fluyan por el escenario. Obtendrás el archivo en la salida.

Javascript #1: Convertir a base64

Ilustración del código JS que necesitas Para extraer el texto

Este es el código que me dio la IA. Puedes tomarlo aquí(nº 1). Sustituye const fileContentPath por tu objeto del nodo anterior.

Petición HTTP

Busca Solicitud HTTP en la lista de acciones. Para saber cómo crearla, visita la documentación de ConvertAPI. Aquí podemos obtener información sobre cómo configurar la solicitud.

Así es como se ve mi solicitud de conversión de pdf a txt.

Ilustración de la configuración correcta de las solicitudes HTTP

Utilizo un objeto del nodo Buscar archivo de Google Drive para especificar el nombre del archivo descargado, y el contenido del archivo en base64 del nodo Javascript. Y añado el par Content-Type=application/json en las cabeceras.

Ilustración de la configuración correcta de las solicitudes HTTP

Ejecuta el nodo una vez para obtener el archivo de la petición HTTP.

Javascript nº 2

Ilustración del código JS que necesitas Para extraer el texto

Otro nodo de código, el nº 2 aquí.

Esta vez, le pedí a la IA que extrajera texto del archivo txt.

Nodos ChatGPT

Aquí nos enfrentaremos a 3 nodos GPT:

  • Crear hilo
  • Crear mensaje
  • Crear ejecución

 Cada nodo realiza una acción con OpenAI.

Primero creamos un hilo, o conversación con el Asistente GPT

Ilustración de cómo crear nodos ChatGPT y cómo utilizar la clave AP

Introduce tu clave API de Open AI, ¡ya está! Ejecuta el nodo una vez y obtén el id del hilo creado en la salida.

Crear mensaje:

ilustración de cómo crear el masaje adecuado para el AI Support Assistent

Aquí necesitas de nuevo una clave API. En el campo ID del hilo pon el resultado del nodo anterior. Lo verás en la ventana de ayuda después de hacer clic en el campo de entrada.

En "Contenido del mensaje" da algunas instrucciones adicionales si quieres y pon el contenido del archivo del último nodo Javascript. ¡El extractor de pdf automatizado está un paso más cerca!

Crear ejecución

Ilustración Cómo crear tu carrera para ver el resultado

Este nodo recibe la respuesta del pdf scraper.

Especifica el nodo igual que tu asistente OpenAI y utiliza el ID de asistente GPT.

Javascript nº 3

Ilustración del código JS que necesitas Para extraer el texto

Aquí utilizamos el nodo JS la última vez, para hacer 3 objetos json separados de la respuesta de los Asistentes.

Este es el ejemplo, sólo tienes que poner tus datos en content const.

Hojas de cálculo de Google

Pongamos estos datos en algún sitio, Google Sheets es una buena opción para este escenario de extracción de datos pdf en latenode.com.

ilustración de la configuración de Google Sheets que necesitas

Vuelve a entrar en la cuenta de gmail para obtener el token de acceso, elige la unidad y la hoja, y pon jsons en los campos, guarda el escenario y haz clic en ejecutar una vez para ejecutar o desplegar el escenario para activar el activador de programación.

Resultados

Los resultados del trabajo que hemos realizado

Tras una ejecución satisfactoria del escenario, este flujo de trabajo extraerá el texto del archivo pdf de tu Google Drive y lo introducirá en tu Hoja de Cálculo de Google.

Así se crea un extractor de pdf sin código en latenode.

Como te prometí, aquí tienes la plantilla de este flujo de trabajo. Sólo tienes que copiarla y seguir este artículo guía para configurarla.

Hay un vídeo sobre ello, ¡no te molestes en leer!

Si quieres que alguien te ayude, echa un vistazo a nuestro canal de Discord, ¡tenemos algunos devs en él dispuestos a ayudar!

Categorías

AI
TI y Desarrollo
Publicidad y marketing

PREGUNTAS FRECUENTES

¿Puedo utilizar Latenode si no estoy familiarizado con la programación?

Sí, Latenode está diseñado para usuarios de todos los niveles. Ofrece funciones avanzadas para los que dominan JavaScript y herramientas visuales intuitivas y asistencia de IA para los principiantes. Tanto si eres un desarrollador experimentado como si eres un principiante, Latenode te ofrece una experiencia fácil de usar y adaptada a tu nivel de habilidad.‍‍

¿Puede Latenode integrarse con servicios y API de terceros?

Sí, Latenode admite la integración con una amplia gama de servicios y API de terceros. Puedes conectar Latenode a varias plataformas en línea, bases de datos y sistemas de software para automatizar las transferencias de datos, desencadenar acciones y agilizar los flujos de trabajo. Latenode también proporciona herramientas y recursos para facilitar el proceso de integración.

¿Existe una versión gratuita de Latenode ?

Sí, Latenode ofrece una versión gratuita que te permite explorar sus capacidades. Esta versión incluye un subconjunto de funciones de Latenode, lo que te permite empezar con la automatización y experimentar sus ventajas. Luego puedes decidir si quieres pasar a un plan de pago para obtener funciones y recursos adicionales.

¿Qué es Latenode?

Latenode es una herramienta de automatización visible e intuitiva diseñada para permitir a los clientes agilizar sus flujos de trabajo mediante la automatización. Permite a los clientes crear estrategias informatizadas mediante la conexión de diversas ofertas de Internet y gadgets, permitiéndoles automatizar obligaciones y decorar la productividad con éxito.

¿Cómo ayuda Latenode a maximizar las oportunidades?

Al integrar todas tus herramientas de marketing en un solo lugar mediante la integración de datos, Latenode te ayuda a obtener una visión global de tus operaciones. Esto te permite identificar oportunidades potenciales más fácilmente y tomar decisiones informadas basadas en datos precisos.