PRECIOS
PRODUCTO
SOLUCIONES
por caso de uso
saber más
BlogPlantillasVídeosYoutubeRECURSOS
COMUNIDADES Y MEDIOS SOCIALES
SOCIOS
Utilizando nuestro producto, los usuarios pueden agilizar su flujo de trabajo y extraer eficazmente texto de los PDF en cuestión de minutos. Nuestro sistema automatizado elimina la necesidad de introducir datos manualmente, reduciendo el riesgo de errores y aumentando la productividad general. Con unos simples clics, los usuarios pueden extraer texto de varios archivos PDF simultáneamente, lo que lo convierte en una valiosa herramienta tanto para empresas como para particulares.
¡Construye tu extractor automatizado de pdf a texto en un minuto! La solución perfecta para quienes trabajan con grandes cantidades de CV u otros documentos. ¡Extrae datos de documentos mediante un flujo de trabajo remoto en Latenode.com!
En este artículo verás cómo crear un flujo de trabajo automatizado sin código que extraerá datos de los archivos PDF de tu Google Drive utilizando la API y el Chat GPT, y rellenando el formulario de Google Sheet con los datos.
Además, ¡puedes conseguir gratis la plantilla de ese escenario que puedes copiar y utilizar para ti!
Puedes actualizar esta plantilla o utilizarla no sólo para extraer texto de pdf.
Veamos primero todo el escenario del pdf scraper, y luego desglosemos cada paso.
¿Cómo funciona este escenario de extracción de pdf? Una vez cada hora, coge todos los CV en formato pdf de Google Drive, conviértelos a archivos txt mediante una petición HTTP y, a continuación, el asistente chatGPT extrae los datos necesarios y rellena la hoja de cálculo de Google.
Y aquí tienes unas instrucciones paso a paso para los que quieran aprender el proceso. Recuerda que al final del artículo encontrarás plantillas gratuitas y listas para usar.
Para este escenario, necesitarás tener la capacidad de utilizar Asistentes de IA Abiertos y cualquier convertidor de API.
Es muy sencillo. Entra en tu cuenta de OpenAI, luego ve a asistentesy haz clic en el botón "crear" de la esquina superior derecha. Verás el panel de configuración del asistente.
Aquí tienes que hacerlo:
Copia el ID del asistente (lo verás bajo la columna Nombre), y luego ve a Claves APIcrea una y guárdala.
Utiliza el que quieras. Yo utilicé ConvertAPI porque tiene una versión de prueba gratuita y proporciona mucha información.
Ahora cambiamos a Latenode.com. Aquí, tenemos que crear el escenario de conversión de pdf a texto: (No necesitas crearlo desde cero, simplemente copia la plantilla que hay al final del artículo)
Haz clic en "Añadir nodo" en la pestaña de escenario, elige "Programar" en la lista. Haz clic en el nodo para configurarlo. Especifica el intervalo y la zona horaria, guarda los cambios. También he añadido un activador en Ejecutar una vez, sólo por comodidad.
Haz clic en "Añadir nodo", busca la carpeta Google drive en la pestaña de acciones y elige el nodo "Buscar archivo".
Para que funcione, tienes que iniciar sesión en la cuenta de gmail para obtener el token de acceso, elegir la unidad y el nombre de búsqueda. En este caso, quiero extraer datos de archivos que tengan CV en su nombre.
A continuación, añade "Descargar archivo" desde la misma carpeta de acciones de Google drive.
Utiliza el id de los resultados del nodo anterior, y luego haz clic en ejecutar nodo una vez para guardar los cambios y hacer que los datos fluyan por el escenario. Obtendrás el archivo en la salida.
Este es el código que me dio la IA. Puedes tomarlo aquí(nº 1). Sustituye const fileContentPath por tu objeto del nodo anterior.
Busca Solicitud HTTP en la lista de acciones. Para saber cómo crearla, visita la documentación de ConvertAPI. Aquí podemos obtener información sobre cómo configurar la solicitud.
Así es como se ve mi solicitud de conversión de pdf a txt.
Utilizo un objeto del nodo Buscar archivo de Google Drive para especificar el nombre del archivo descargado, y el contenido del archivo en base64 del nodo Javascript. Y añado el par Content-Type=application/json en las cabeceras.
Ejecuta el nodo una vez para obtener el archivo de la petición HTTP.
Otro nodo de código, el nº 2 aquí.
Esta vez, le pedí a la IA que extrajera texto del archivo txt.
Aquí nos enfrentaremos a 3 nodos GPT:
Cada nodo realiza una acción con OpenAI.
Primero creamos un hilo, o conversación con el Asistente GPT
Introduce tu clave API de Open AI, ¡ya está! Ejecuta el nodo una vez y obtén el id del hilo creado en la salida.
Aquí necesitas de nuevo una clave API. En el campo ID del hilo pon el resultado del nodo anterior. Lo verás en la ventana de ayuda después de hacer clic en el campo de entrada.
En "Contenido del mensaje" da algunas instrucciones adicionales si quieres y pon el contenido del archivo del último nodo Javascript. ¡El extractor de pdf automatizado está un paso más cerca!
Este nodo recibe la respuesta del pdf scraper.
Especifica el nodo igual que tu asistente OpenAI y utiliza el ID de asistente GPT.
Aquí utilizamos el nodo JS la última vez, para hacer 3 objetos json separados de la respuesta de los Asistentes.
Este es el ejemplo, sólo tienes que poner tus datos en content const.
Pongamos estos datos en algún sitio, Google Sheets es una buena opción para este escenario de extracción de datos pdf en latenode.com.
Vuelve a entrar en la cuenta de gmail para obtener el token de acceso, elige la unidad y la hoja, y pon jsons en los campos, guarda el escenario y haz clic en ejecutar una vez para ejecutar o desplegar el escenario para activar el activador de programación.
Tras una ejecución satisfactoria del escenario, este flujo de trabajo extraerá el texto del archivo pdf de tu Google Drive y lo introducirá en tu hoja de cálculo de Google.
Así se crea un extractor de pdf sin código en latenode.
Como te prometí, aquí tienes la plantilla de este flujo de trabajo. Sólo tienes que copiarla y seguir este artículo guía para configurarla.
Hay un vídeo sobre ello, ¡no te molestes en leer!
Si quieres que alguien te ayude, echa un vistazo a nuestro canal de Discord, ¡tenemos algunos devs en él dispuestos a ayudar!
Sí, Latenode está diseñado para usuarios de todos los niveles. Ofrece funciones avanzadas para los que dominan JavaScript y herramientas visuales intuitivas y asistencia de IA para los principiantes. Tanto si eres un desarrollador experimentado como si eres un principiante, Latenode te ofrece una experiencia fácil de usar y adaptada a tu nivel de habilidad.
Sí, Latenode admite la integración con una amplia gama de servicios y API de terceros. Puedes conectar Latenode a varias plataformas en línea, bases de datos y sistemas de software para automatizar las transferencias de datos, desencadenar acciones y agilizar los flujos de trabajo. Latenode también proporciona herramientas y recursos para facilitar el proceso de integración.
Sí, Latenode ofrece una versión gratuita que te permite explorar sus capacidades. Esta versión incluye un subconjunto de funciones de Latenode, lo que te permite empezar con la automatización y experimentar sus ventajas. Luego puedes decidir si quieres pasar a un plan de pago para obtener funciones y recursos adicionales.
Latenode es una herramienta de automatización visible e intuitiva diseñada para permitir a los clientes agilizar sus flujos de trabajo mediante la automatización. Permite a los clientes crear estrategias informatizadas mediante la conexión de diversas ofertas de Internet y gadgets, permitiéndoles automatizar obligaciones y decorar la productividad con éxito.
Al integrar todas tus herramientas de marketing en un solo lugar mediante la integración de datos, Latenode te ayuda a obtener una visión global de tus operaciones. Esto te permite identificar oportunidades potenciales más fácilmente y tomar decisiones informadas basadas en datos precisos.