Compartir a través de


Scaffolder zanran (versión preliminar)

Zanran Scaffolder extrae tablas y texto de archivos PDF o de imagen. Las tablas se extraen como Excel o XML, texto como XML. El scaffolder es mejor para informes como estados financieros, documentos científicos, informes de agentes... Inicialmente, puede probar los documentos mediante el sitio manual, anónimo, práctica: www.zanrandemoapi.com

Este conector está disponible en los siguientes productos y regiones:

Service Class Regions
Copilot Studio Premium Todas las regiones de Power Automate excepto las siguientes:
     - Gobierno de EE. UU. (GCC)
     - Gobierno de EE. UU. (GCC High)
     - China Cloud operado por 21Vianet
     - Departamento de Defensa de EE. UU. (DoD)
Aplicaciones lógicas Estándar Todas las regiones de Logic Apps excepto las siguientes:
     - Regiones de Azure Government
     - Regiones de Azure China
     - Departamento de Defensa de EE. UU. (DoD)
Power Apps Premium Todas las regiones de Power Apps excepto las siguientes:
     - Gobierno de EE. UU. (GCC)
     - Gobierno de EE. UU. (GCC High)
     - China Cloud operado por 21Vianet
     - Departamento de Defensa de EE. UU. (DoD)
Power Automate Premium Todas las regiones de Power Automate excepto las siguientes:
     - Gobierno de EE. UU. (GCC)
     - Gobierno de EE. UU. (GCC High)
     - China Cloud operado por 21Vianet
     - Departamento de Defensa de EE. UU. (DoD)
Contacto
Nombre Contacto de Zanran
URL https://pdf.zanran.com/contact-us
Correo Electrónico helpdesk@zanran.com
Metadatos del conector
Publicador Zanran Ltd
Sitio web http://www.zanran.com
Directiva de privacidad https://pdf.zanran.com/privacy-policy
Categorías Contenido y archivos; Productividad

El servidor Scaffolder de Zanran proporciona una API web que permite a los usuarios extraer automáticamente contenido de archivos PDF e imágenes. Está diseñado principalmente para extraer de informes (cuentas anuales, documentos científicos, informes de mercado, etc.) El motor scaffolder de Zanran determina automáticamente la estructura y el diseño de estos documentos y extrae contenido en partes constituyentes: bloques de texto (por ejemplo, párrafos); Mesas; e imágenes/gráficos. Usa Computer Vision y Machine Learning y genera datos en formatos estructurados como Excel y XML. Es escalable y no requiere ninguna intervención manual ni plantillas predefinidas, ningún entrenamiento o configuración. El software es independiente del lenguaje y se crea para que los entornos de automatización o RPA procesen millones de archivos.

Prerrequisitos

Este conector accede a un servicio gratuito para la extracción de texto y tablas de bajo volumen de archivos PDF. Requisito previo: un nombre de usuario (dirección de correo electrónico) y una contraseña (que invente).

Obtención de credenciales

Regístrese en: http://scaffolderlink.zanran.com/

Problemas y limitaciones conocidos

Se recomienda realizar pruebas con archivos PDF "nativos", en lugar de examinarlos, para eliminar los efectos de OCR.

Creación de una conexión

El conector admite los siguientes tipos de autenticación:

Predeterminado Parámetros para crear una conexión. Todas las regiones No se puede compartir

Predeterminado

Aplicable: Todas las regiones

Parámetros para crear una conexión.

Esta conexión no se puede compartir. Si la aplicación de energía se comparte con otro usuario, se pedirá a otro usuario que cree explícitamente una nueva conexión.

Nombre Tipo Description Obligatorio
nombre de usuario securestring El nombre de usuario de esta API Cierto
contraseña securestring La contraseña de esta API Cierto

Limitaciones

Nombre Llamadas Período de renovación
Llamadas API por conexión 100 60 segundos

Acciones

Cargar documento

Cargar documento

Descarga de resultados como archivos Xml comprimidos

Descarga un archivo ZIP que contiene los resultados del análisis en formato Xml (un archivo Xml por página)

Descarga de resultados como un archivo Znr

Descarga los resultados en forma de un archivo Znr que luego se puede ver y editar por Pdf Workbench (una herramienta Zanran diseñada para este propósito)

Descargar resultados como Xlsx

Descarga los resultados del análisis de tablas como un documento de Excel (Xlsx) con hojas de cálculo independientes para cada tabla.

Obtener estado

Obtenga el estado del documento que se está cargando, es decir, si está en la cola que se va a procesar, se está procesando o ha terminado de procesarse.

Cargar documento

Cargar documento

Parámetros

Nombre Clave Requerido Tipo Description
archivo
file True file

El archivo de documento que se va a cargar

Página de inicio
startPage integer

Página de inicio si se analiza solo un intervalo

Página final
endPage integer

Página de finalización si se analiza solo un intervalo

Coords
Coords string

Coordenadas de la tabla que se va a analizar (para procesar una sola página). NOTA: Se trata de un requisito especializado; Si desea usar este parámetro, póngase en contacto con nosotros para helpdesk@zanran.com preguntar cómo continuar.

Devoluciones

response
string

Descarga de resultados como archivos Xml comprimidos

Descarga un archivo ZIP que contiene los resultados del análisis en formato Xml (un archivo Xml por página)

Parámetros

Nombre Clave Requerido Tipo Description
Nombre del documento sin extensión
docname True string

el nombre de archivo del documento original sin la extensión

Devoluciones

response
file

Descarga de resultados como un archivo Znr

Descarga los resultados en forma de un archivo Znr que luego se puede ver y editar por Pdf Workbench (una herramienta Zanran diseñada para este propósito)

Parámetros

Nombre Clave Requerido Tipo Description
Nombre del documento sin extensión
docname True string

el nombre de archivo del documento original sin la extensión

Devoluciones

response
file

Descargar resultados como Xlsx

Descarga los resultados del análisis de tablas como un documento de Excel (Xlsx) con hojas de cálculo independientes para cada tabla.

Parámetros

Nombre Clave Requerido Tipo Description
Nombre del documento sin extensión
docname True string

el nombre de archivo del documento original sin la extensión

Devoluciones

response
file

Obtener estado

Obtenga el estado del documento que se está cargando, es decir, si está en la cola que se va a procesar, se está procesando o ha terminado de procesarse.

Parámetros

Nombre Clave Requerido Tipo Description
Nombre del documento sin extensión
docname True string

el nombre del archivo de documento original sin la extensión

Devoluciones

response
string

Definiciones

archivo

Este es el tipo de datos básico "file".

cuerda / cadena

Este es el tipo de datos básico "string".