Compartir a través de


Aquaforest PDF

El conector aquaforest PDF contiene un grupo de acciones que realizan diferentes operaciones pdf, como la división, extracción de texto, extracción de códigos de barras y operaciones de OCR para Office 365 y Power Automate.

Este conector está disponible en los siguientes productos y regiones:

Service Class Regions
Copilot Studio Premium Todas las regiones de Power Automate excepto las siguientes:
     - Gobierno de EE. UU. (GCC)
     - Gobierno de EE. UU. (GCC High)
     - China Cloud operado por 21Vianet
     - Departamento de Defensa de EE. UU. (DoD)
Aplicaciones lógicas Estándar Todas las regiones de Logic Apps excepto las siguientes:
     - Regiones de Azure Government
     - Regiones de Azure China
     - Departamento de Defensa de EE. UU. (DoD)
Power Apps Premium Todas las regiones de Power Apps excepto las siguientes:
     - Gobierno de EE. UU. (GCC)
     - Gobierno de EE. UU. (GCC High)
     - China Cloud operado por 21Vianet
     - Departamento de Defensa de EE. UU. (DoD)
Power Automate Premium Todas las regiones de Power Automate excepto las siguientes:
     - Gobierno de EE. UU. (GCC)
     - Gobierno de EE. UU. (GCC High)
     - China Cloud operado por 21Vianet
     - Departamento de Defensa de EE. UU. (DoD)
Contacto
Nombre Soporte técnico de Aquaforest
URL https://www.aquaforest.com/en/aquaforest-flow-doc.asp
Correo Electrónico support@aquaforest.com
Metadatos del conector
Publicador Aquaforest Limited
Sitio web https://www.aquaforest.com/en/aquaforest-connector.asp
Directiva de privacidad https://www.aquaforest.com/en/privacy policy.pdf
Categorías Contenido y archivos; Datos

El conector aquaforest PDF contiene un grupo de acciones que realizan diferentes operaciones pdf, como la división, extracción de texto, extracción de códigos de barras y operaciones de OCR para Office 365 y Flow.

Prerrequisitos

En primer lugar, debe crear una cuenta de API de Aquaforest PDF. Esta cuenta se usa para administrar acciones de Aquaforest PDF y la API de PDF de Aquaforest. Use la dirección de correo electrónico activa, ya que la suscripción estará vinculada a esta dirección. Si ya tiene una cuenta, inicie sesión aquí.

Obtención de credenciales

  1. Inicie sesión en el portal para desarrolladores, vaya a la página Productos y seleccione el producto al que desea suscribirse.

  2. Haga clic en el botón Suscribirse .

  3. Haga clic en el botón Confirmar para confirmar la solicitud de suscripción.

  4. Puede acceder a las claves de API en la página Perfil.

Creación de una conexión

El conector admite los siguientes tipos de autenticación:

Predeterminado Parámetros para crear una conexión. Todas las regiones No se puede compartir

Predeterminado

Aplicable: Todas las regiones

Parámetros para crear una conexión.

Esta conexión no se puede compartir. Si la aplicación de energía se comparte con otro usuario, se pedirá a otro usuario que cree explícitamente una nueva conexión.

Nombre Tipo Description Obligatorio
Clave de API securestring La clave de API de esta API Cierto

Limitaciones

Nombre Llamadas Período de renovación
Llamadas API por conexión 100 60 segundos

Acciones

Dividir PDF por coincidencia de texto

Divide los archivos PDF en función de las coincidencias de texto definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener documentación. Además, la Herramienta de extracción zonal de Aquaforest está disponible en [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Dividir PDF por código de barras

Divide los archivos PDF en función de las coincidencias de código de barras definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener documentación. Además, la Herramienta de extracción zonal de Aquaforest está disponible en [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Dividir PDF por página

Divide los archivos PDF en función de las opciones de división definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener documentación.

Extracción de páginas PDF por código de barras

Extraiga archivos PDF basados en coincidencias de código de barras definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información.

Extracción de páginas PDF por texto

Extraiga archivos PDF basados en coincidencias de texto definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información.

Obtención de datos de PDF

Esta acción extraerá datos importantes de archivos PDF en forma de pares clave-valor.

Obtener el valor de código de barras

Obtenga código de barras en PDF. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información.

Obtener propiedades de PDF

Obtiene la información sobre un archivo PDF.

Obtener texto de PDF

Obtener texto de archivos PDF en función de la ubicación de texto y las expresiones regulares. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información.

OCR PDF o imágenes

Generar PDF que se puede buscar a partir de un PDF de imagen o imágenes escaneadas. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información.

Dividir PDF por coincidencia de texto

Divide los archivos PDF en función de las coincidencias de texto definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener documentación. Además, la Herramienta de extracción zonal de Aquaforest está disponible en [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Parámetros

Nombre Clave Requerido Tipo Description
Contenido del archivo
fileContent True byte

Contenido del archivo de origen

Plantilla de nombre de archivo
fileNameTemplate True string

Plantilla para el archivo de salida si se encuentran coincidencias de texto

Páginas sin coincidencia
noMatch string

En función de la opción de división que elija anteriormente, algunas páginas no tendrán ningún valor de texto extraído. Elija qué hacer en estas páginas.

Sin plantilla de archivo
noTextFileName True string

Plantilla para el archivo de salida si no se encuentra ninguna coincidencia de texto

Nombre de archivo
sourceFileName True string

Nombre del archivo de origen

Opciones del archivo de salida
splitOption string

Elija la ubicación de la página con el código de barras en los archivos de salida de la operación de división.

Importancia
expression array of string

Proporcione uno o más valores aquí para usarlos con la propiedad anterior, devolveremos el primer valor de texto que coincida con la regla indicada anteriormente.

Ubicación
location True string

Área de la página: use la herramienta Zonal para obtener coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Seleccionar
position string

Úselo para refinar el texto que extraiga más, seleccione una opción que coincida con sus requisitos.

Modelo
regex string

Si se proporciona una expresión regular aquí, coincidiremos con cualquier texto extraído y devolveremos la coincidencia.

Devoluciones

Dividir PDF por código de barras

Divide los archivos PDF en función de las coincidencias de código de barras definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener documentación. Además, la Herramienta de extracción zonal de Aquaforest está disponible en [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Parámetros

Nombre Clave Requerido Tipo Description
Contenido del archivo
fileContent True byte

Contenido del archivo de origen

Plantilla de nombre de archivo
fileNameTemplate True string

Plantilla para el archivo de salida si se encuentra el código de barras

Páginas sin coincidencia
noMatch string

Dependiendo de la opción de división que elija anteriormente, algunas páginas no tendrán ningún valor de código de barras. Elija qué hacer en estas páginas.

Sin plantilla de coincidencia de código de barras
noTextFileName True string

Plantilla para el archivo de salida si no se encuentra ningún código de barras

Nombre de archivo
sourceFileName True string

Nombre del archivo de origen

Opciones del archivo de salida
splitOption string

Úselo para refinar el texto que extraiga más, seleccione una opción que coincida con sus requisitos.

Tipo
barcodeFormats array of string

Especificar los tipos de código de barras que desea identificar

Ubicación
location True string

Área de la página: use la herramienta Zonal para obtener coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Modelo
regex string

Si se proporciona una expresión regular aquí, coincidiremos con cualquier código de barras extraído y devolveremos la coincidencia.

Devoluciones

Dividir PDF por página

Divide los archivos PDF en función de las opciones de división definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener documentación.

Parámetros

Nombre Clave Requerido Tipo Description
Contenido del archivo
fileContent True byte

Contenido del archivo de origen.

Nombre del archivo de salida
fileNameTemplate True string

Plantilla de archivo de destino que puede incluir %UNIQUEn (número único a partir de 1, cero rellenado en n dígitos) y %FILENAME (nombre de archivo original sin la extensión).

Nombre de archivo
sourceFileName True string

Nombre del archivo de origen.

Tipo de división
splitOption True string

Elija la operación de división que se usará para cada archivo.

Intervalo de páginas
pageRange string

Conjunto de intervalos de página separados por comas que definen qué páginas del original se deben extraer.

Repetir cada
repeatEvery integer

Aplique el intervalo de páginas a cada conjunto de páginas intervalos de páginas del documento. Por ejemplo, si se especifica 2-4 para intervalos de páginas y 4 se especifica como intervalo repetido, el intervalo se vuelve a aplicar cada 4 páginas.

Conservar marcadores
retainBookmarks boolean

Los archivos generados incluirán marcadores del archivo original.

Conservar metadatos
retainMetadata boolean

Los archivos generados incluirán metadatos (como Author y Title) del archivo original.

Devoluciones

Extracción de páginas PDF por código de barras

Extraiga archivos PDF basados en coincidencias de código de barras definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información.

Parámetros

Nombre Clave Requerido Tipo Description
Contenido del archivo
fileContent True byte

Contenido del archivo de origen

Plantilla de nombre de archivo
fileNameTemplate True string

Plantilla para el archivo de salida si se encuentra el código de barras

Sin plantilla de archivo
noTextFileName True string

Plantilla para el archivo de salida si no se encuentra ningún código de barras

Nombre de archivo
sourceFileName True string

Nombre del archivo de origen

Tipo
barcodeFormats array of string

Especificar los tipos de código de barras que desea identificar

Ubicación
location True string

Área de la página: use la herramienta Zonal para obtener coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Modelo
regex string

Si se proporciona una expresión regular aquí, coincidiremos con cualquier código de barras extraído y devolveremos la coincidencia.

Devoluciones

Extracción de páginas PDF por texto

Extraiga archivos PDF basados en coincidencias de texto definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información.

Parámetros

Nombre Clave Requerido Tipo Description
Contenido del archivo
fileContent True byte

Contenido del archivo de origen

Plantilla de nombre de archivo
fileNameTemplate True string

Plantilla para el archivo de salida si se encuentran coincidencias de texto

Sin plantilla de archivo
noTextFileName True string

Plantilla para el archivo de salida si no se encuentra ninguna coincidencia de texto

Nombre de archivo
sourceFileName True string

Nombre del archivo de origen

Importancia
expression array of string

Proporcione uno o más valores aquí para usarlos con la propiedad anterior, devolveremos el primer valor de texto que coincida con la regla indicada anteriormente.

Ubicación
location True string

Área de la página: use la herramienta Zonal para obtener coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Seleccionar
position string

Úselo para refinar el texto que extraiga más, seleccione una opción que coincida con sus requisitos.

Modelo
regex string

Si se proporciona una expresión regular aquí, coincidiremos con cualquier texto extraído y devolveremos la coincidencia.

Devoluciones

Obtención de datos de PDF

Esta acción extraerá datos importantes de archivos PDF en forma de pares clave-valor.

Parámetros

Nombre Clave Requerido Tipo Description
Nombre
settingName True string

Escriba el nombre de la configuración aquí.

Importancia
settingValue True string

Escriba el valor de la configuración aquí.

Puntuación de confianza
confidenceScore number

Establezca una puntuación de confianza más alta para filtrar los valores con menor confianza. Puede establecer cualquier valor entre 0 y 1. Se recomienda comenzar desde la versión 0.5

Conversión de fecha
dateAsISO string

Seleccione el formato para devolver el valor de fecha como

Claves esperadas
expectedKeys string

Proporcione un nombre de clave por línea para que los valores estén disponibles para acciones posteriores sin analizar JSON.

Contenido del archivo
fileContent True byte

Contenido del archivo de origen

Límite de página
pageLimit integer

Número máximo de páginas que se van a procesar

Intervalo de páginas
pageRange string

Representación de cadena de los números de página que desea procesar. Por ejemplo, 1,3-4

Seccionamiento de símbolo de moneda
stripCurrencySymbol boolean

Establézcalo en true si desea que se quiten los símbolos y las cadenas antes de devolver valores de moneda.

Sinónimo de coincidencia
synonym boolean

Establézcalo en true si desea que devuelvamos todas las claves que son sinónimos de la clave esperada.

Diccionario de sinónimos
synonymDictionary string

Puede proporcionar una matriz JSON de objetos "entry", donde cada objeto contiene una lista de sinónimos de una matriz. Por ejemplo, si desea que "Invoice No" y "Invoice Number" (sin distinción entre mayúsculas y minúsculas) se interpreten como la misma clave, use el siguiente JSON: [{'entry': [ 'Invoice No', 'invoice number' ]}]

Recortar símbolos
trimSymbols boolean

Establézcalo en true si desea que quitemos todos los símbolos iniciales y finales de las claves encontradas antes de que los coincidamos con una clave esperada.

Devoluciones

Las salidas de esta operación son dinámicas.

Obtener el valor de código de barras

Obtenga código de barras en PDF. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información.

Parámetros

Nombre Clave Requerido Tipo Description
Plantilla de resultado de código de barras
barcodeResultTemplate True string

Plantilla para el resultado del texto de salida si se encuentra un código de barras

Contenido del archivo
fileContent True byte

Contenido del archivo de origen

Sin plantilla de código de barras
noBarcodeTemplate True string

Plantilla para el resultado del texto de salida si no se encuentra ningún código de barras

Separador de página
pageSeparator string

Proporcione un separador de página para que pueda saber dónde están los saltos de página.

Páginas
pagerange string

Proporcione un intervalo de páginas del que desea extraer texto, puede ser un número de página único (1), varios números de página separados por comas (1,2,3), un intervalo de páginas (1-4) o una mezcla de todos (1,2,4-7).

Nombre de archivo
sourceFileName True string

Nombre del archivo de origen

Tipo
barcodeFormats array of string

Especificar los tipos de código de barras que desea identificar

Ubicación
location True string

Área de la página: use la herramienta Zonal para obtener coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Página (en desuso)
pagenumber integer

Esta propiedad está en desuso, le recomendamos que use la propiedad Pages. La propiedad Pages se aplica a todas las zonas y permite seleccionar las páginas que desea procesar.

Modelo
regex string

Si se proporciona una expresión regular aquí, coincidiremos con cualquier texto extraído y devolveremos la coincidencia.

Devoluciones

Obtener propiedades de PDF

Obtiene la información sobre un archivo PDF.

Parámetros

Nombre Clave Requerido Tipo Description
Contenido del archivo
fileContent True byte

Contenido del archivo de origen

Límite de página
pageLimit integer

Número máximo de páginas que se van a procesar, solo se usa para comprobar si las páginas contienen texto oculto o para comprobar si se puede buscar en PDF.

Devoluciones

Obtener texto de PDF

Obtener texto de archivos PDF en función de la ubicación de texto y las expresiones regulares. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información.

Parámetros

Nombre Clave Requerido Tipo Description
Contenido del archivo
fileContent True byte

Contenido del archivo de origen

Sin plantilla de coincidencia de texto
noTextTemplate True string

Plantilla para el texto que se va a devolver si no se encuentra una coincidencia

Separador de página
pageSeparator string

Proporcione un separador de página para que pueda saber dónde están los saltos de página.

Páginas
pagerange string

Proporcione un intervalo de páginas del que desea extraer texto, puede ser un número de página único (1), varios números de página separados por comas (1,2,3), un intervalo de páginas (1-4) o una mezcla de todos (1,2,4-7).

Nombre de archivo
sourceFileName True string

Nombre del archivo de origen

Plantilla de resultado de texto
textResultTemplate True string

Plantilla para que se devuelva el texto si se encuentra una coincidencia

Importancia
expression array of string

Proporcione uno o más valores aquí para usarlos con la propiedad anterior, devolveremos el primer valor de texto que coincida con la regla indicada anteriormente.

Ubicación
location True string

Área de la página: use la herramienta Zonal para obtener coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Página (en desuso)
pagenumber integer

Esta propiedad está en desuso, le recomendamos que use la propiedad Pages. La propiedad Pages se aplica a todas las zonas y permite seleccionar las páginas que desea procesar.

Seleccionar
position string

Úselo para refinar el texto que extraiga más, seleccione una opción que coincida con sus requisitos.

Modelo
regex string

Si se proporciona una expresión regular aquí, coincidiremos con cualquier texto extraído y devolveremos la coincidencia.

Devoluciones

OCR PDF o imágenes

Generar PDF que se puede buscar a partir de un PDF de imagen o imágenes escaneadas. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información.

Parámetros

Nombre Clave Requerido Tipo Description
AquaforestImageTimeout
aquaforestImageTimeout integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

Autor
author string

Establezca un autor personalizado en las propiedades del documento PDF de salida.

Rotación automática
autorotate boolean

Rotación automática de la imagen: esto garantizará que todo el texto orientado normalmente

Binarize
binarize integer

Por lo general, este valor solo se debe usar en instrucciones del soporte técnico. Puede controlar la forma en que se procesan las imágenes de color y fuerzan la binarización con un umbral determinado. Por lo general, se ha demostrado que un valor de 200 da buenos resultados en las pruebas, pero esto debe confirmarse con documentos de cliente "típicos". Al establecer esto en -1 se usa un método alternativo que intentará separar el texto de cualquier imagen de fondo o colores. Esto puede proporcionar resultados de OCR mejorados para determinados documentos, como páginas de periódicos y revistas.

Límite de píxeles negros
blackPixelLimit float

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

Umbral de página en blanco
blankPageThreshold integer

Úselo para establecer el número mínimo de "En píxeles" que deben estar presentes en la imagen para que una página no se considere en blanco. Un valor de -1 desactivará la detección de páginas en blanco.

Tamaño del cuadro
boxSize integer

Esta opción es ideal para formularios en los que, a veces, los cuadros alrededor del texto pueden hacer que un área se identifique como gráficos. Esta opción quita los cuadros de la copia temporal de la imagen usada por el motor de OCR. No quita cuadros de la imagen final. Técnicamente, esta opción quita los elementos conectados con un área mínima (en píxeles y definida por esta propiedad). Esta opción solo se aplica actualmente a las imágenes bi-tonal.

ConvertToTiff
convertToTiff boolean

Cada página del documento PDF se rasteriza en una imagen TIFF.

CreateProcess
createProcess boolean

Establézcalo en true si desea iniciar el proceso a través de pinvoke.

Fecha de creación
creationDate string

Establezca una fecha de creación personalizada en las propiedades del documento PDF de salida. La cadena de fecha debe tener el formato "aaaa-MM-dd HH:mm:ss".

Deskew
deskew boolean

Deskew (recta) la imagen.

Despeckle
despeckle integer

Esto quita todos los elementos desconectados de la imagen que tienen alto o ancho en píxeles inferiores a la figura especificada. El valor máximo es 9 y el valor predeterminado es 0.

DictionaryLookup
dictionaryLookup integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

Dotmatrix
dotmatrix boolean

Establézcalo en true para mejorar el reconocimiento de fuentes de matriz de puntos. El valor predeterminado es Falso. Si se establece en true para las fuentes que no son de matriz de puntos, el reconocimiento puede ser deficiente.

Habilitación de la salida de depuración
enableDebugOutput boolean

Habilita la salida de depuración.

Comprimir PDF (MRC)
enableMrc boolean

Esto permite la compresión de trama mixta que puede reducir drásticamente el tamaño de salida de los ARCHIVOS PDF que incluyen exámenes de color. Tenga en cuenta que esta opción solo es adecuada cuando el origen no es un PDF o mediante ConvertToTiff.

Salida de PDF/A
enablePDFAOutput boolean

Indica si se va a generar como PDF/A.

Modo de error
errorMode integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

Contenido del archivo de origen
fileContent True byte

Contenido del archivo en OCR

Nombre de archivo de origen con extensión
fileNameWithExtension True string

Nombre de archivo de origen con extensión o simplemente la extensión (con un punto inicial ".")

Detección de volteo
flipDetect integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

Calidad de escala de grises
grayscaleQuality integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

Heurística
heuristics integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

Jbig2EncFlags
jbig2EncFlags string

Estas son las marcas que se pasarán a la aplicación usada para generar versiones JBIG2 de imágenes usadas en la generación de PDF (suponiendo que esta compresión está habilitada). Por lo general, esta opción solo se debe usar en instrucciones del soporte técnico.

Language
language enum

Al seleccionar una de las opciones siguientes, se establece el idioma que se usará para el procesamiento de OCR. El idioma predeterminado es el inglés.

LibTiffSavePageAsBmp
libTiffSavePageAsBmp boolean

A veces, si hay una imagen que es 1bpp y tiene compresión LZW, el preprocesamiento puede hacer que el color de la imagen se inverta (blanco a blanco y blanco a negro). Establézcalo en true para evitarlo.

Número máximo de escritorios
maxDeskew float

Ángulo máximo por el que se enviará una página. Por lo general, esta opción solo se debe usar en instrucciones del soporte técnico (support@aquaforest.com).

Confianza mínima de deskew
minDeskewConfidence float

Por lo general, esta opción solo se debe usar en instrucciones del soporte técnico (support@aquaforest.com).

Fecha de modificación
modifiedDate string

Establezca una fecha de modificación personalizada en las propiedades del documento PDF de salida. La cadena de fecha debe tener el formato "aaaa-MM-dd HH:mm:ss".

Morfo
morph string

Opciones morfológicas que se aplicarán a la imagen binarizada antes de OCR. Si se establece en vacío, no se aplica ninguno. Entre las opciones comunes se incluyen las que se enumeran a continuación, pero para obtener más opciones, póngase en contacto con support@aquaforest.com.

MrcBackgroundFactor
mrcBackgroundFactor integer

Tamaño de muestreo para la parte de fondo de la imagen. Cuanto mayor sea el número, mayor será el tamaño de los bloques de imagen utilizados para el promedio, lo que provocará una reducción del tamaño, pero también de la calidad. El valor predeterminado es 3

MrcForegroundFactor
mrcForegroundFactor integer

Tamaño de muestreo para la parte en primer plano de la imagen. Cuanto mayor sea el número, mayor será el tamaño de los bloques de imagen utilizados para el promedio, lo que provocará una reducción del tamaño, pero también de la calidad. El valor predeterminado es 3

MrcQuality
mrcQuality integer

Configuración de calidad JPEG (valor porcentual 1 - 100) para su uso en guardar el fondo y las imágenes en primer plano. El valor predeterminado es 75

MrcTimeout
mrcTimeout integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

NoPictures
noPictures boolean

De forma predeterminada, si un área del documento se identifica como un área gráfica, no se ejecuta ningún procesamiento de OCR en esa área. Sin embargo, algunos documentos pueden incluir áreas o cuadros que se identifican como áreas "gráficas" o "imágenes", pero que realmente contienen texto útil. Si se establece NoPictures en True, se omitirán las áreas identificadas como imágenes, mientras que si se establece en False, se forzará el OCR de las áreas identificadas como imágenes.

OcrProcessSetupTimeout
ocrProcessSetupTimeout integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

OcrTimeout
ocrTimeout integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

Contraseña
password string

Contraseña para abrir el archivo PDF de código fuente

PdfToImageBpp
pdfToImageBpp enum

Bits por píxel que se va a usar para la página PDF rasterizada al usar el motor 1. Esto solo se aplica a los documentos procesados mediante ConvertToTiff. El valor predeterminado de esta propiedad se toma de la página PDF.

PdfToImageCompression
pdfToImageCompression enum

Compresión que se va a establecer en las imágenes extraídas o rasterizadas de cada página del archivo PDF de origen. A continuación, estas imágenes son OCRed para crear el PDF que se puede buscar. El valor predeterminado de esta propiedad se toma de cada página del archivo PDF de origen.

PdfToImageDpi
pdfToImageDpi enum

PPP que se va a establecer en las imágenes rasterizadas desde cada página del archivo PDF de origen. A continuación, estas imágenes son OCRed para crear el PDF que se puede buscar. El valor predeterminado de esta propiedad se toma de cada página del archivo PDF de origen.

PdfToImageForceVectorCheck
pdfToImageForceVectorCheck boolean

Esta configuración es útil cuando se trabaja con documentos que contienen objetos vectoriales (por ejemplo, dibujos CAD). De forma predeterminada, las páginas que contienen solo objetos vectoriales se rasterizan. Las páginas que no tienen imágenes, sino que contienen objetos vectoriales, así como texto electrónico, se omiten de la rasterización. Sin embargo, a veces puede haber una página que contenga objetos vectoriales (dibujos CAD), pero su título puede estar en texto electrónico. Para forzar la rasterización de páginas como estas, establezca esta propiedad en true.

PdfToImageIncludeText
pdfToImageIncludeText boolean

Cuando se establece en False, esto impedirá que la conversión del texto real (es decir, se genere electrónicamente en lugar de texto que forma parte de una imagen escaneada) se represente en las imágenes de página extraídas del PDF. Esto se debe a que el texto ya se puede buscar y, por lo general, no requiere OCR. Sin embargo, el valor se puede establecer en True si el OCR es necesario en este texto real.

PdfToImageMaxRes
pdfToImageMaxRes integer

Resolución máxima de las imágenes rasterizadas. Si la resolución recuperada de la página PDF es mayor que este valor, se establecerá en este valor. El valor predeterminado de esta propiedad es 600.

PdfToImageMinRes
pdfToImageMinRes integer

Resolución mínima de las imágenes rasterizadas. Si la resolución recuperada de la página PDF es inferior a este valor, se establecerá en este valor. El valor predeterminado de esta propiedad es 200.

Pdf/A Versión
pdfaVersion enum

La versión pdf/A.

PipeClientConnectionTimeout
pipeClientConnectionTimeout integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

RemoveBlankPage
removeBlankPage boolean

Quite páginas en blanco cuando BlankPageThreshold sea mayor que -1 y ConvertToTiff sea true.

RemoveLines
removeLines boolean

Quite las líneas de las imágenes fpr mejor reconocimiento.

RestartEngineEvery
restartEngineEvery integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

Conservar marcadores
retainBookmarks boolean

Conserva los marcadores del archivo de origen en la salida cuando se usa ConvertToTiff.

Conservar la fecha de creación
retainCreationDate boolean

Conserva la fecha de creación del archivo de origen en las propiedades del documento PDF de salida.

Conservar metadatos
retainMetadata boolean

Conserva los metadatos del archivo de origen en la salida cuando se usa ConvertToTiff.

Conservar la fecha de modificación
retainModifiedDate boolean

Conserva la fecha de modificación del archivo de origen en las propiedades del documento PDF de salida.

Conservar las preferencias del visor
retainViewerPreferences boolean

Conserva las preferencias del visor de PDF, el modo de página y el diseño de página del archivo de origen en la salida cuando se usa ConvertToTiff.

SavePredespeckle
savePredespeckle boolean

Esto usará la imagen original (es decir, antes de aplicar el preprocesamiento) en el PDF de salida.

Tables
tables boolean

Esta opción cuando se establece en true, intenta OCR dentro de las celdas de la tabla.

TextLayerFilterHeight
textLayerFilterHeight integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

TextLayerFilterHeightInverted
textLayerFilterHeightInverted integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

TextLayerFilterPercentage
textLayerFilterPercentage float

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

TextLayerFilterPercentageInverted
textLayerFilterPercentageInverted float

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

TextLayerFilterRatio
textLayerFilterRatio float

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

TextLayerFilterRatioInverted
textLayerFilterRatioInverted float

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

TextLayerFilterWidth
textLayerFilterWidth integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

TextLayerFilterWidthInverted
textLayerFilterWidthInverted integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

TextLayerMaxBoxes
textLayerMaxBoxes integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

Modo de tídy up
tidyUpMode integer

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

Validar PDF/A
validatePDFA boolean

Si se va a validar o no el documento PDF/A después de la conversión

Umbral de coincidencia de Word
wordMatchThreshold float

Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad.

Devoluciones

Datos de respuesta para la operación OCR

Definiciones

ApiExtractPost200ApplicationJsonResponse

Nombre Ruta de acceso Tipo Description
Error
ErrorMessage string

Si el valor de Is Successful es false, se devolverá un mensaje de error.

Se ha realizado correctamente
IsSuccessful boolean

Esto devolverá true si se extrajo al menos una página

Información de licencia
LicenceInfo string

Información sobre la clave de suscripción de API

Extraer archivos de salida
SplittedFile array of object

Matriz de archivos extraídos

(Contenido del archivo)
SplittedFile.SplitFileContent byte

Cadena base 64 que representa el contenido del archivo

(Nombre de archivo)
SplittedFile.SplitFileName string

Cadena que contiene el nombre de archivo generado

(Número de página)
SplittedFile.pageNumber string

Intervalo de páginas que contiene el número de página donde se produjo la extracción.

ApiGetTextValueJsonResponse

Nombre Ruta de acceso Tipo Description
Mensaje de error
ErrorMessage string

Si el valor de Is Successful es false, se devolverá un mensaje de error.

Se ha realizado correctamente
IsSuccessful boolean

Si el texto se ha coinciden correctamente

Información de licencia
LicenceInfo string

Información sobre la clave de suscripción de API

Resultado del texto
TextResult string

Cadena generada a partir de la aplicación del texto extraído a la plantilla de resultado de texto proporcionada. Tenga en cuenta que si el recuento de páginas es mayor que uno concatenará todas las páginas mediante el separador de páginas.

Results
TextResults array of object

Matriz que contiene una lista de páginas y los valores de texto extraídos

(Número de página)
TextResults.pageNumber string

Página donde se encontró el texto

(Texto de página)
TextResults.valueExtracted string

Cadena generada a partir de la aplicación del texto extraído a la plantilla de resultado de texto proporcionada.

(Valores de zona)
TextResults.zoneValues array of string

Matriz que contiene el texto extraído de cada zona.

ApiRenameByBarcodePost200ApplicationJsonResponse

Nombre Ruta de acceso Tipo Description
Código de barras
BarcodeResult string

Cadena generada a partir de la aplicación del texto extraído a la plantilla de resultado de código de barras proporcionada. Tenga en cuenta que si el recuento de páginas es mayor que uno concatenará todas las páginas mediante el separador de páginas.

Results
BarcodeResults array of object

Matriz que contiene una lista de páginas y los valores de código de barras extraídos

(Número de página)
BarcodeResults.pageNumber string

Página donde se encontró el código de barras

(Código de barras de página)
BarcodeResults.valueExtracted string

Cadena generada a partir de la aplicación del valor de código de barras extraído a la plantilla de resultado de código de barras proporcionada.

(Valores de zona)
BarcodeResults.zoneValues array of string

Matriz que contiene el código de barras extraído de cada zona.

Mensaje de error
ErrorMessage string

Si el valor de Is Successful es false, se devolverá un mensaje de error.

Se ha realizado correctamente
IsSuccessful boolean

Si se detectó un código de barras

Información de licencia
LicenceInfo string

Información sobre la clave de suscripción de API

ApiSplitPost200ApplicationJsonResponse

Nombre Ruta de acceso Tipo Description
Mensaje de error
ErrorMessage string

Si el valor de Is Successful es false, se devolverá un mensaje de error.

Se ha realizado correctamente
IsSuccessful boolean

Esto devolverá true si se ha coinciden al menos una página dividida.

Información de licencia
LicenceInfo string

Información sobre la clave de suscripción de API

Dividir archivos de salida
SplittedFile array of object

Matriz que contiene cada uno de los archivos divididos junto con detalles como el nombre de archivo generado y el número de página.

(Contenido del archivo)
SplittedFile.SplitFileContent byte

Cadena base 64 que representa el contenido del archivo

(Nombre de archivo)
SplittedFile.SplitFileName string

Cadena que contiene el nombre de archivo generado

(Intervalo de páginas)
SplittedFile.pageNumber string

Intervalo de páginas que contiene los números de página de la operación de división

GetPDFInfoResponse

Nombre Ruta de acceso Tipo Description
Permitir ensamblado
AllowAssembly boolean

Permite la rotación, inserción o eliminación de páginas.

Permitir impresión degradada
AllowDegradedPrinting boolean

Permitir impresión de baja calidad.

Permitir extraer contenido
AllowExtractContents boolean

Permitir la extracción de texto y gráficos.

Permitir extracción para accesibilidad
AllowExtractForAccessibility boolean

Permite la extracción de texto y gráficos compatibles con la accesibilidad.

Permitir rellenar formulario
AllowFillInForm boolean

Permitir el llenado de campos de formulario.

Permitir modificar anotaciones
AllowModifyAnnotations boolean

Permitir la modificación de anotaciones.

Permitir modificar contenido
AllowModifyContents boolean

Permitir la modificación del contenido.

Permitir impresión
AllowPrinting boolean

Permitir impresión de alta calidad.

Autor
Author string

Quién creó el documento.

Fecha de creación
CreationDate string

Esta es la fecha y hora en que se creó el PDF.

Creador
Creator string

La aplicación o biblioteca de origen.

Mensaje de error
ErrorMessage string

Si el valor de Is Successful es false, se devolverá un mensaje de error.

Tamaño de archivo (bytes)
FileSize number

Tamaño del archivo en bytes

Tiene texto oculto
HasHiddenText boolean

Esto devolverá true si el archivo PDF tiene una capa de OCR.

Is Encrypted
IsEncrypted boolean

Esto devolverá true si este documento está cifrado o no.

Se puede buscar
IsSearchable boolean

Esto devolverá true si el archivo PDF se puede buscar.

Se ha realizado correctamente
IsSuccessful boolean

Devuelve true si la acción se realizó correctamente.

Palabras clave
Keywords string

Las palabras clave pueden estar separadas por comas.

Información de licencia
LicenceInfo string

Resumen json de la cuota de suscripción.

Fecha de modificación
ModifiedDate string

Esta propiedad representa la fecha y hora en que se modificó por última vez el PDF.

Número de páginas
NumberofPages integer

Número de páginas del archivo PDF.

Versión de PDF
PDFversion number

Versión de la especificación pdf en la que se creó el documento.

Producer
Producer string

Producto que creó el PDF. En los primeros días de pdf, los usuarios usarían una aplicación Creator como Microsoft Word para escribir un documento, imprimirlo en un archivo PostScript y, a continuación, el productor sería Acrobat Distiller, la aplicación que convirtió el archivo PostScript en un PDF. Hoy en día Creador y Productor a menudo son los mismos o un campo se deja en blanco.

Asunto
Subject string

Sobre qué consiste el documento.

Title
Title string

El título del documento.

Atrapado
Trapped string

Esta propiedad es un valor booleano que indica si el documento se ha atrapado. La captura es un proceso previo a la presión que introduce áreas de color en separaciones de color para ocultar posibles errores de registro.

Metadatos XMP
XmpMetadata string

La Plataforma extensible de metadatos (XMP) es un estándar ISO creado originalmente por Adobe Systems Inc., para la creación, el procesamiento y el intercambio de metadatos estandarizados y personalizados para documentos digitales y conjuntos de datos.

ocr_response

Datos de respuesta para la operación OCR

Nombre Ruta de acceso Tipo Description
Mensaje de error
ErrorMessage string

Si el valor de Is Successful es false, se devolverá un mensaje de error.

Se ha realizado correctamente
IsSuccessful boolean

Devuelve true si el OCR se realizó correctamente.

Información de licencia
LicenceInfo string

Información sobre la clave de suscripción de API

Contenido del archivo de registro
LogFileContent byte

Contenido del registro de la operación

Contenido de archivo procesado
OutputFileContent byte

Archivo generado por el convertidor aquaforest PDF.