Aquaforest PDF
El conector aquaforest PDF contiene un grupo de acciones que realizan diferentes operaciones pdf, como la división, extracción de texto, extracción de códigos de barras y operaciones de OCR para Office 365 y Power Automate.
Este conector está disponible en los siguientes productos y regiones:
| Service | Class | Regions |
|---|---|---|
| Copilot Studio | Premium | Todas las regiones de Power Automate excepto las siguientes: - Gobierno de EE. UU. (GCC) - Gobierno de EE. UU. (GCC High) - China Cloud operado por 21Vianet - Departamento de Defensa de EE. UU. (DoD) |
| Aplicaciones lógicas | Estándar | Todas las regiones de Logic Apps excepto las siguientes: - Regiones de Azure Government - Regiones de Azure China - Departamento de Defensa de EE. UU. (DoD) |
| Power Apps | Premium | Todas las regiones de Power Apps excepto las siguientes: - Gobierno de EE. UU. (GCC) - Gobierno de EE. UU. (GCC High) - China Cloud operado por 21Vianet - Departamento de Defensa de EE. UU. (DoD) |
| Power Automate | Premium | Todas las regiones de Power Automate excepto las siguientes: - Gobierno de EE. UU. (GCC) - Gobierno de EE. UU. (GCC High) - China Cloud operado por 21Vianet - Departamento de Defensa de EE. UU. (DoD) |
| Contacto | |
|---|---|
| Nombre | Soporte técnico de Aquaforest |
| URL | https://www.aquaforest.com/en/aquaforest-flow-doc.asp |
| Correo Electrónico | support@aquaforest.com |
| Metadatos del conector | |
|---|---|
| Publicador | Aquaforest Limited |
| Sitio web | https://www.aquaforest.com/en/aquaforest-connector.asp |
| Directiva de privacidad | https://www.aquaforest.com/en/privacy policy.pdf |
| Categorías | Contenido y archivos; Datos |
El conector aquaforest PDF contiene un grupo de acciones que realizan diferentes operaciones pdf, como la división, extracción de texto, extracción de códigos de barras y operaciones de OCR para Office 365 y Flow.
Prerrequisitos
En primer lugar, debe crear una cuenta de API de Aquaforest PDF. Esta cuenta se usa para administrar acciones de Aquaforest PDF y la API de PDF de Aquaforest. Use la dirección de correo electrónico activa, ya que la suscripción estará vinculada a esta dirección. Si ya tiene una cuenta, inicie sesión aquí.
Obtención de credenciales
Inicie sesión en el portal para desarrolladores, vaya a la página Productos y seleccione el producto al que desea suscribirse.

Haga clic en el botón Suscribirse .

Haga clic en el botón Confirmar para confirmar la solicitud de suscripción.

Puede acceder a las claves de API en la página Perfil.

Creación de una conexión
El conector admite los siguientes tipos de autenticación:
| Predeterminado | Parámetros para crear una conexión. | Todas las regiones | No se puede compartir |
Predeterminado
Aplicable: Todas las regiones
Parámetros para crear una conexión.
Esta conexión no se puede compartir. Si la aplicación de energía se comparte con otro usuario, se pedirá a otro usuario que cree explícitamente una nueva conexión.
| Nombre | Tipo | Description | Obligatorio |
|---|---|---|---|
| Clave de API | securestring | La clave de API de esta API | Cierto |
Limitaciones
| Nombre | Llamadas | Período de renovación |
|---|---|---|
| Llamadas API por conexión | 100 | 60 segundos |
Acciones
| Dividir PDF por coincidencia de texto |
Divide los archivos PDF en función de las coincidencias de texto definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener documentación. Además, la Herramienta de extracción zonal de Aquaforest está disponible en [https://www.aquaforest.com/en/zone/get-pdf-zone.html]. |
| Dividir PDF por código de barras |
Divide los archivos PDF en función de las coincidencias de código de barras definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener documentación. Además, la Herramienta de extracción zonal de Aquaforest está disponible en [https://www.aquaforest.com/en/zone/get-pdf-zone.html]. |
| Dividir PDF por página |
Divide los archivos PDF en función de las opciones de división definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener documentación. |
| Extracción de páginas PDF por código de barras |
Extraiga archivos PDF basados en coincidencias de código de barras definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información. |
| Extracción de páginas PDF por texto |
Extraiga archivos PDF basados en coincidencias de texto definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información. |
| Obtención de datos de PDF |
Esta acción extraerá datos importantes de archivos PDF en forma de pares clave-valor. |
| Obtener el valor de código de barras |
Obtenga código de barras en PDF. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información. |
| Obtener propiedades de PDF |
Obtiene la información sobre un archivo PDF. |
| Obtener texto de PDF |
Obtener texto de archivos PDF en función de la ubicación de texto y las expresiones regulares. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información. |
| OCR PDF o imágenes |
Generar PDF que se puede buscar a partir de un PDF de imagen o imágenes escaneadas. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información. |
Dividir PDF por coincidencia de texto
Divide los archivos PDF en función de las coincidencias de texto definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener documentación. Además, la Herramienta de extracción zonal de Aquaforest está disponible en [https://www.aquaforest.com/en/zone/get-pdf-zone.html].
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Contenido del archivo
|
fileContent | True | byte |
Contenido del archivo de origen |
|
Plantilla de nombre de archivo
|
fileNameTemplate | True | string |
Plantilla para el archivo de salida si se encuentran coincidencias de texto |
|
Páginas sin coincidencia
|
noMatch | string |
En función de la opción de división que elija anteriormente, algunas páginas no tendrán ningún valor de texto extraído. Elija qué hacer en estas páginas. |
|
|
Sin plantilla de archivo
|
noTextFileName | True | string |
Plantilla para el archivo de salida si no se encuentra ninguna coincidencia de texto |
|
Nombre de archivo
|
sourceFileName | True | string |
Nombre del archivo de origen |
|
Opciones del archivo de salida
|
splitOption | string |
Elija la ubicación de la página con el código de barras en los archivos de salida de la operación de división. |
|
|
Importancia
|
expression | array of string |
Proporcione uno o más valores aquí para usarlos con la propiedad anterior, devolveremos el primer valor de texto que coincida con la regla indicada anteriormente. |
|
|
Ubicación
|
location | True | string |
Área de la página: use la herramienta Zonal para obtener coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Seleccionar
|
position | string |
Úselo para refinar el texto que extraiga más, seleccione una opción que coincida con sus requisitos. |
|
|
Modelo
|
regex | string |
Si se proporciona una expresión regular aquí, coincidiremos con cualquier texto extraído y devolveremos la coincidencia. |
Devoluciones
Dividir PDF por código de barras
Divide los archivos PDF en función de las coincidencias de código de barras definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener documentación. Además, la Herramienta de extracción zonal de Aquaforest está disponible en [https://www.aquaforest.com/en/zone/get-pdf-zone.html].
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Contenido del archivo
|
fileContent | True | byte |
Contenido del archivo de origen |
|
Plantilla de nombre de archivo
|
fileNameTemplate | True | string |
Plantilla para el archivo de salida si se encuentra el código de barras |
|
Páginas sin coincidencia
|
noMatch | string |
Dependiendo de la opción de división que elija anteriormente, algunas páginas no tendrán ningún valor de código de barras. Elija qué hacer en estas páginas. |
|
|
Sin plantilla de coincidencia de código de barras
|
noTextFileName | True | string |
Plantilla para el archivo de salida si no se encuentra ningún código de barras |
|
Nombre de archivo
|
sourceFileName | True | string |
Nombre del archivo de origen |
|
Opciones del archivo de salida
|
splitOption | string |
Úselo para refinar el texto que extraiga más, seleccione una opción que coincida con sus requisitos. |
|
|
Tipo
|
barcodeFormats | array of string |
Especificar los tipos de código de barras que desea identificar |
|
|
Ubicación
|
location | True | string |
Área de la página: use la herramienta Zonal para obtener coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Modelo
|
regex | string |
Si se proporciona una expresión regular aquí, coincidiremos con cualquier código de barras extraído y devolveremos la coincidencia. |
Devoluciones
Dividir PDF por página
Divide los archivos PDF en función de las opciones de división definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener documentación.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Contenido del archivo
|
fileContent | True | byte |
Contenido del archivo de origen. |
|
Nombre del archivo de salida
|
fileNameTemplate | True | string |
Plantilla de archivo de destino que puede incluir %UNIQUEn (número único a partir de 1, cero rellenado en n dígitos) y %FILENAME (nombre de archivo original sin la extensión). |
|
Nombre de archivo
|
sourceFileName | True | string |
Nombre del archivo de origen. |
|
Tipo de división
|
splitOption | True | string |
Elija la operación de división que se usará para cada archivo. |
|
Intervalo de páginas
|
pageRange | string |
Conjunto de intervalos de página separados por comas que definen qué páginas del original se deben extraer. |
|
|
Repetir cada
|
repeatEvery | integer |
Aplique el intervalo de páginas a cada conjunto de páginas intervalos de páginas del documento. Por ejemplo, si se especifica 2-4 para intervalos de páginas y 4 se especifica como intervalo repetido, el intervalo se vuelve a aplicar cada 4 páginas. |
|
|
Conservar marcadores
|
retainBookmarks | boolean |
Los archivos generados incluirán marcadores del archivo original. |
|
|
Conservar metadatos
|
retainMetadata | boolean |
Los archivos generados incluirán metadatos (como Author y Title) del archivo original. |
Devoluciones
Extracción de páginas PDF por código de barras
Extraiga archivos PDF basados en coincidencias de código de barras definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Contenido del archivo
|
fileContent | True | byte |
Contenido del archivo de origen |
|
Plantilla de nombre de archivo
|
fileNameTemplate | True | string |
Plantilla para el archivo de salida si se encuentra el código de barras |
|
Sin plantilla de archivo
|
noTextFileName | True | string |
Plantilla para el archivo de salida si no se encuentra ningún código de barras |
|
Nombre de archivo
|
sourceFileName | True | string |
Nombre del archivo de origen |
|
Tipo
|
barcodeFormats | array of string |
Especificar los tipos de código de barras que desea identificar |
|
|
Ubicación
|
location | True | string |
Área de la página: use la herramienta Zonal para obtener coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Modelo
|
regex | string |
Si se proporciona una expresión regular aquí, coincidiremos con cualquier código de barras extraído y devolveremos la coincidencia. |
Devoluciones
Extracción de páginas PDF por texto
Extraiga archivos PDF basados en coincidencias de texto definidas por el usuario. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Contenido del archivo
|
fileContent | True | byte |
Contenido del archivo de origen |
|
Plantilla de nombre de archivo
|
fileNameTemplate | True | string |
Plantilla para el archivo de salida si se encuentran coincidencias de texto |
|
Sin plantilla de archivo
|
noTextFileName | True | string |
Plantilla para el archivo de salida si no se encuentra ninguna coincidencia de texto |
|
Nombre de archivo
|
sourceFileName | True | string |
Nombre del archivo de origen |
|
Importancia
|
expression | array of string |
Proporcione uno o más valores aquí para usarlos con la propiedad anterior, devolveremos el primer valor de texto que coincida con la regla indicada anteriormente. |
|
|
Ubicación
|
location | True | string |
Área de la página: use la herramienta Zonal para obtener coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Seleccionar
|
position | string |
Úselo para refinar el texto que extraiga más, seleccione una opción que coincida con sus requisitos. |
|
|
Modelo
|
regex | string |
Si se proporciona una expresión regular aquí, coincidiremos con cualquier texto extraído y devolveremos la coincidencia. |
Devoluciones
Obtención de datos de PDF
Esta acción extraerá datos importantes de archivos PDF en forma de pares clave-valor.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Nombre
|
settingName | True | string |
Escriba el nombre de la configuración aquí. |
|
Importancia
|
settingValue | True | string |
Escriba el valor de la configuración aquí. |
|
Puntuación de confianza
|
confidenceScore | number |
Establezca una puntuación de confianza más alta para filtrar los valores con menor confianza. Puede establecer cualquier valor entre 0 y 1. Se recomienda comenzar desde la versión 0.5 |
|
|
Conversión de fecha
|
dateAsISO | string |
Seleccione el formato para devolver el valor de fecha como |
|
|
Claves esperadas
|
expectedKeys | string |
Proporcione un nombre de clave por línea para que los valores estén disponibles para acciones posteriores sin analizar JSON. |
|
|
Contenido del archivo
|
fileContent | True | byte |
Contenido del archivo de origen |
|
Límite de página
|
pageLimit | integer |
Número máximo de páginas que se van a procesar |
|
|
Intervalo de páginas
|
pageRange | string |
Representación de cadena de los números de página que desea procesar. Por ejemplo, 1,3-4 |
|
|
Seccionamiento de símbolo de moneda
|
stripCurrencySymbol | boolean |
Establézcalo en true si desea que se quiten los símbolos y las cadenas antes de devolver valores de moneda. |
|
|
Sinónimo de coincidencia
|
synonym | boolean |
Establézcalo en true si desea que devuelvamos todas las claves que son sinónimos de la clave esperada. |
|
|
Diccionario de sinónimos
|
synonymDictionary | string |
Puede proporcionar una matriz JSON de objetos "entry", donde cada objeto contiene una lista de sinónimos de una matriz. Por ejemplo, si desea que "Invoice No" y "Invoice Number" (sin distinción entre mayúsculas y minúsculas) se interpreten como la misma clave, use el siguiente JSON: [{'entry': [ 'Invoice No', 'invoice number' ]}] |
|
|
Recortar símbolos
|
trimSymbols | boolean |
Establézcalo en true si desea que quitemos todos los símbolos iniciales y finales de las claves encontradas antes de que los coincidamos con una clave esperada. |
Devoluciones
Obtener el valor de código de barras
Obtenga código de barras en PDF. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Plantilla de resultado de código de barras
|
barcodeResultTemplate | True | string |
Plantilla para el resultado del texto de salida si se encuentra un código de barras |
|
Contenido del archivo
|
fileContent | True | byte |
Contenido del archivo de origen |
|
Sin plantilla de código de barras
|
noBarcodeTemplate | True | string |
Plantilla para el resultado del texto de salida si no se encuentra ningún código de barras |
|
Separador de página
|
pageSeparator | string |
Proporcione un separador de página para que pueda saber dónde están los saltos de página. |
|
|
Páginas
|
pagerange | string |
Proporcione un intervalo de páginas del que desea extraer texto, puede ser un número de página único (1), varios números de página separados por comas (1,2,3), un intervalo de páginas (1-4) o una mezcla de todos (1,2,4-7). |
|
|
Nombre de archivo
|
sourceFileName | True | string |
Nombre del archivo de origen |
|
Tipo
|
barcodeFormats | array of string |
Especificar los tipos de código de barras que desea identificar |
|
|
Ubicación
|
location | True | string |
Área de la página: use la herramienta Zonal para obtener coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Página (en desuso)
|
pagenumber | integer |
Esta propiedad está en desuso, le recomendamos que use la propiedad Pages. La propiedad Pages se aplica a todas las zonas y permite seleccionar las páginas que desea procesar. |
|
|
Modelo
|
regex | string |
Si se proporciona una expresión regular aquí, coincidiremos con cualquier texto extraído y devolveremos la coincidencia. |
Devoluciones
Obtener propiedades de PDF
Obtiene la información sobre un archivo PDF.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Contenido del archivo
|
fileContent | True | byte |
Contenido del archivo de origen |
|
Límite de página
|
pageLimit | integer |
Número máximo de páginas que se van a procesar, solo se usa para comprobar si las páginas contienen texto oculto o para comprobar si se puede buscar en PDF. |
Devoluciones
- Body
- GetPDFInfoResponse
Obtener texto de PDF
Obtener texto de archivos PDF en función de la ubicación de texto y las expresiones regulares. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Contenido del archivo
|
fileContent | True | byte |
Contenido del archivo de origen |
|
Sin plantilla de coincidencia de texto
|
noTextTemplate | True | string |
Plantilla para el texto que se va a devolver si no se encuentra una coincidencia |
|
Separador de página
|
pageSeparator | string |
Proporcione un separador de página para que pueda saber dónde están los saltos de página. |
|
|
Páginas
|
pagerange | string |
Proporcione un intervalo de páginas del que desea extraer texto, puede ser un número de página único (1), varios números de página separados por comas (1,2,3), un intervalo de páginas (1-4) o una mezcla de todos (1,2,4-7). |
|
|
Nombre de archivo
|
sourceFileName | True | string |
Nombre del archivo de origen |
|
Plantilla de resultado de texto
|
textResultTemplate | True | string |
Plantilla para que se devuelva el texto si se encuentra una coincidencia |
|
Importancia
|
expression | array of string |
Proporcione uno o más valores aquí para usarlos con la propiedad anterior, devolveremos el primer valor de texto que coincida con la regla indicada anteriormente. |
|
|
Ubicación
|
location | True | string |
Área de la página: use la herramienta Zonal para obtener coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Página (en desuso)
|
pagenumber | integer |
Esta propiedad está en desuso, le recomendamos que use la propiedad Pages. La propiedad Pages se aplica a todas las zonas y permite seleccionar las páginas que desea procesar. |
|
|
Seleccionar
|
position | string |
Úselo para refinar el texto que extraiga más, seleccione una opción que coincida con sus requisitos. |
|
|
Modelo
|
regex | string |
Si se proporciona una expresión regular aquí, coincidiremos con cualquier texto extraído y devolveremos la coincidencia. |
Devoluciones
OCR PDF o imágenes
Generar PDF que se puede buscar a partir de un PDF de imagen o imágenes escaneadas. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obtener más información.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
AquaforestImageTimeout
|
aquaforestImageTimeout | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
Autor
|
author | string |
Establezca un autor personalizado en las propiedades del documento PDF de salida. |
|
|
Rotación automática
|
autorotate | boolean |
Rotación automática de la imagen: esto garantizará que todo el texto orientado normalmente |
|
|
Binarize
|
binarize | integer |
Por lo general, este valor solo se debe usar en instrucciones del soporte técnico. Puede controlar la forma en que se procesan las imágenes de color y fuerzan la binarización con un umbral determinado. Por lo general, se ha demostrado que un valor de 200 da buenos resultados en las pruebas, pero esto debe confirmarse con documentos de cliente "típicos". Al establecer esto en -1 se usa un método alternativo que intentará separar el texto de cualquier imagen de fondo o colores. Esto puede proporcionar resultados de OCR mejorados para determinados documentos, como páginas de periódicos y revistas. |
|
|
Límite de píxeles negros
|
blackPixelLimit | float |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
Umbral de página en blanco
|
blankPageThreshold | integer |
Úselo para establecer el número mínimo de "En píxeles" que deben estar presentes en la imagen para que una página no se considere en blanco. Un valor de -1 desactivará la detección de páginas en blanco. |
|
|
Tamaño del cuadro
|
boxSize | integer |
Esta opción es ideal para formularios en los que, a veces, los cuadros alrededor del texto pueden hacer que un área se identifique como gráficos. Esta opción quita los cuadros de la copia temporal de la imagen usada por el motor de OCR. No quita cuadros de la imagen final. Técnicamente, esta opción quita los elementos conectados con un área mínima (en píxeles y definida por esta propiedad). Esta opción solo se aplica actualmente a las imágenes bi-tonal. |
|
|
ConvertToTiff
|
convertToTiff | boolean |
Cada página del documento PDF se rasteriza en una imagen TIFF. |
|
|
CreateProcess
|
createProcess | boolean |
Establézcalo en true si desea iniciar el proceso a través de pinvoke. |
|
|
Fecha de creación
|
creationDate | string |
Establezca una fecha de creación personalizada en las propiedades del documento PDF de salida. La cadena de fecha debe tener el formato "aaaa-MM-dd HH:mm:ss". |
|
|
Deskew
|
deskew | boolean |
Deskew (recta) la imagen. |
|
|
Despeckle
|
despeckle | integer |
Esto quita todos los elementos desconectados de la imagen que tienen alto o ancho en píxeles inferiores a la figura especificada. El valor máximo es 9 y el valor predeterminado es 0. |
|
|
DictionaryLookup
|
dictionaryLookup | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
Dotmatrix
|
dotmatrix | boolean |
Establézcalo en true para mejorar el reconocimiento de fuentes de matriz de puntos. El valor predeterminado es Falso. Si se establece en true para las fuentes que no son de matriz de puntos, el reconocimiento puede ser deficiente. |
|
|
Habilitación de la salida de depuración
|
enableDebugOutput | boolean |
Habilita la salida de depuración. |
|
|
Comprimir PDF (MRC)
|
enableMrc | boolean |
Esto permite la compresión de trama mixta que puede reducir drásticamente el tamaño de salida de los ARCHIVOS PDF que incluyen exámenes de color. Tenga en cuenta que esta opción solo es adecuada cuando el origen no es un PDF o mediante ConvertToTiff. |
|
|
Salida de PDF/A
|
enablePDFAOutput | boolean |
Indica si se va a generar como PDF/A. |
|
|
Modo de error
|
errorMode | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
Contenido del archivo de origen
|
fileContent | True | byte |
Contenido del archivo en OCR |
|
Nombre de archivo de origen con extensión
|
fileNameWithExtension | True | string |
Nombre de archivo de origen con extensión o simplemente la extensión (con un punto inicial ".") |
|
Detección de volteo
|
flipDetect | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
Calidad de escala de grises
|
grayscaleQuality | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
Heurística
|
heuristics | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
Jbig2EncFlags
|
jbig2EncFlags | string |
Estas son las marcas que se pasarán a la aplicación usada para generar versiones JBIG2 de imágenes usadas en la generación de PDF (suponiendo que esta compresión está habilitada). Por lo general, esta opción solo se debe usar en instrucciones del soporte técnico. |
|
|
Language
|
language | enum |
Al seleccionar una de las opciones siguientes, se establece el idioma que se usará para el procesamiento de OCR. El idioma predeterminado es el inglés. |
|
|
LibTiffSavePageAsBmp
|
libTiffSavePageAsBmp | boolean |
A veces, si hay una imagen que es 1bpp y tiene compresión LZW, el preprocesamiento puede hacer que el color de la imagen se inverta (blanco a blanco y blanco a negro). Establézcalo en true para evitarlo. |
|
|
Número máximo de escritorios
|
maxDeskew | float |
Ángulo máximo por el que se enviará una página. Por lo general, esta opción solo se debe usar en instrucciones del soporte técnico (support@aquaforest.com). |
|
|
Confianza mínima de deskew
|
minDeskewConfidence | float |
Por lo general, esta opción solo se debe usar en instrucciones del soporte técnico (support@aquaforest.com). |
|
|
Fecha de modificación
|
modifiedDate | string |
Establezca una fecha de modificación personalizada en las propiedades del documento PDF de salida. La cadena de fecha debe tener el formato "aaaa-MM-dd HH:mm:ss". |
|
|
Morfo
|
morph | string |
Opciones morfológicas que se aplicarán a la imagen binarizada antes de OCR. Si se establece en vacío, no se aplica ninguno. Entre las opciones comunes se incluyen las que se enumeran a continuación, pero para obtener más opciones, póngase en contacto con support@aquaforest.com. |
|
|
MrcBackgroundFactor
|
mrcBackgroundFactor | integer |
Tamaño de muestreo para la parte de fondo de la imagen. Cuanto mayor sea el número, mayor será el tamaño de los bloques de imagen utilizados para el promedio, lo que provocará una reducción del tamaño, pero también de la calidad. El valor predeterminado es 3 |
|
|
MrcForegroundFactor
|
mrcForegroundFactor | integer |
Tamaño de muestreo para la parte en primer plano de la imagen. Cuanto mayor sea el número, mayor será el tamaño de los bloques de imagen utilizados para el promedio, lo que provocará una reducción del tamaño, pero también de la calidad. El valor predeterminado es 3 |
|
|
MrcQuality
|
mrcQuality | integer |
Configuración de calidad JPEG (valor porcentual 1 - 100) para su uso en guardar el fondo y las imágenes en primer plano. El valor predeterminado es 75 |
|
|
MrcTimeout
|
mrcTimeout | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
NoPictures
|
noPictures | boolean |
De forma predeterminada, si un área del documento se identifica como un área gráfica, no se ejecuta ningún procesamiento de OCR en esa área. Sin embargo, algunos documentos pueden incluir áreas o cuadros que se identifican como áreas "gráficas" o "imágenes", pero que realmente contienen texto útil. Si se establece NoPictures en True, se omitirán las áreas identificadas como imágenes, mientras que si se establece en False, se forzará el OCR de las áreas identificadas como imágenes. |
|
|
OcrProcessSetupTimeout
|
ocrProcessSetupTimeout | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
OcrTimeout
|
ocrTimeout | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
Contraseña
|
password | string |
Contraseña para abrir el archivo PDF de código fuente |
|
|
PdfToImageBpp
|
pdfToImageBpp | enum |
Bits por píxel que se va a usar para la página PDF rasterizada al usar el motor 1. Esto solo se aplica a los documentos procesados mediante ConvertToTiff. El valor predeterminado de esta propiedad se toma de la página PDF. |
|
|
PdfToImageCompression
|
pdfToImageCompression | enum |
Compresión que se va a establecer en las imágenes extraídas o rasterizadas de cada página del archivo PDF de origen. A continuación, estas imágenes son OCRed para crear el PDF que se puede buscar. El valor predeterminado de esta propiedad se toma de cada página del archivo PDF de origen. |
|
|
PdfToImageDpi
|
pdfToImageDpi | enum |
PPP que se va a establecer en las imágenes rasterizadas desde cada página del archivo PDF de origen. A continuación, estas imágenes son OCRed para crear el PDF que se puede buscar. El valor predeterminado de esta propiedad se toma de cada página del archivo PDF de origen. |
|
|
PdfToImageForceVectorCheck
|
pdfToImageForceVectorCheck | boolean |
Esta configuración es útil cuando se trabaja con documentos que contienen objetos vectoriales (por ejemplo, dibujos CAD). De forma predeterminada, las páginas que contienen solo objetos vectoriales se rasterizan. Las páginas que no tienen imágenes, sino que contienen objetos vectoriales, así como texto electrónico, se omiten de la rasterización. Sin embargo, a veces puede haber una página que contenga objetos vectoriales (dibujos CAD), pero su título puede estar en texto electrónico. Para forzar la rasterización de páginas como estas, establezca esta propiedad en true. |
|
|
PdfToImageIncludeText
|
pdfToImageIncludeText | boolean |
Cuando se establece en False, esto impedirá que la conversión del texto real (es decir, se genere electrónicamente en lugar de texto que forma parte de una imagen escaneada) se represente en las imágenes de página extraídas del PDF. Esto se debe a que el texto ya se puede buscar y, por lo general, no requiere OCR. Sin embargo, el valor se puede establecer en True si el OCR es necesario en este texto real. |
|
|
PdfToImageMaxRes
|
pdfToImageMaxRes | integer |
Resolución máxima de las imágenes rasterizadas. Si la resolución recuperada de la página PDF es mayor que este valor, se establecerá en este valor. El valor predeterminado de esta propiedad es 600. |
|
|
PdfToImageMinRes
|
pdfToImageMinRes | integer |
Resolución mínima de las imágenes rasterizadas. Si la resolución recuperada de la página PDF es inferior a este valor, se establecerá en este valor. El valor predeterminado de esta propiedad es 200. |
|
|
Pdf/A Versión
|
pdfaVersion | enum |
La versión pdf/A. |
|
|
PipeClientConnectionTimeout
|
pipeClientConnectionTimeout | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
RemoveBlankPage
|
removeBlankPage | boolean |
Quite páginas en blanco cuando BlankPageThreshold sea mayor que -1 y ConvertToTiff sea true. |
|
|
RemoveLines
|
removeLines | boolean |
Quite las líneas de las imágenes fpr mejor reconocimiento. |
|
|
RestartEngineEvery
|
restartEngineEvery | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
Conservar marcadores
|
retainBookmarks | boolean |
Conserva los marcadores del archivo de origen en la salida cuando se usa ConvertToTiff. |
|
|
Conservar la fecha de creación
|
retainCreationDate | boolean |
Conserva la fecha de creación del archivo de origen en las propiedades del documento PDF de salida. |
|
|
Conservar metadatos
|
retainMetadata | boolean |
Conserva los metadatos del archivo de origen en la salida cuando se usa ConvertToTiff. |
|
|
Conservar la fecha de modificación
|
retainModifiedDate | boolean |
Conserva la fecha de modificación del archivo de origen en las propiedades del documento PDF de salida. |
|
|
Conservar las preferencias del visor
|
retainViewerPreferences | boolean |
Conserva las preferencias del visor de PDF, el modo de página y el diseño de página del archivo de origen en la salida cuando se usa ConvertToTiff. |
|
|
SavePredespeckle
|
savePredespeckle | boolean |
Esto usará la imagen original (es decir, antes de aplicar el preprocesamiento) en el PDF de salida. |
|
|
Tables
|
tables | boolean |
Esta opción cuando se establece en true, intenta OCR dentro de las celdas de la tabla. |
|
|
TextLayerFilterHeight
|
textLayerFilterHeight | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
TextLayerFilterHeightInverted
|
textLayerFilterHeightInverted | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
TextLayerFilterPercentage
|
textLayerFilterPercentage | float |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
TextLayerFilterPercentageInverted
|
textLayerFilterPercentageInverted | float |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
TextLayerFilterRatio
|
textLayerFilterRatio | float |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
TextLayerFilterRatioInverted
|
textLayerFilterRatioInverted | float |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
TextLayerFilterWidth
|
textLayerFilterWidth | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
TextLayerFilterWidthInverted
|
textLayerFilterWidthInverted | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
TextLayerMaxBoxes
|
textLayerMaxBoxes | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
Modo de tídy up
|
tidyUpMode | integer |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
|
|
Validar PDF/A
|
validatePDFA | boolean |
Si se va a validar o no el documento PDF/A después de la conversión |
|
|
Umbral de coincidencia de Word
|
wordMatchThreshold | float |
Póngase en contacto con el soporte técnico (support@aquaforest.com) para obtener instrucciones sobre el uso de esta propiedad. |
Devoluciones
Datos de respuesta para la operación OCR
- Body
- ocr_response
Definiciones
ApiExtractPost200ApplicationJsonResponse
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Error
|
ErrorMessage | string |
Si el valor de Is Successful es false, se devolverá un mensaje de error. |
|
Se ha realizado correctamente
|
IsSuccessful | boolean |
Esto devolverá true si se extrajo al menos una página |
|
Información de licencia
|
LicenceInfo | string |
Información sobre la clave de suscripción de API |
|
Extraer archivos de salida
|
SplittedFile | array of object |
Matriz de archivos extraídos |
|
(Contenido del archivo)
|
SplittedFile.SplitFileContent | byte |
Cadena base 64 que representa el contenido del archivo |
|
(Nombre de archivo)
|
SplittedFile.SplitFileName | string |
Cadena que contiene el nombre de archivo generado |
|
(Número de página)
|
SplittedFile.pageNumber | string |
Intervalo de páginas que contiene el número de página donde se produjo la extracción. |
ApiGetTextValueJsonResponse
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Mensaje de error
|
ErrorMessage | string |
Si el valor de Is Successful es false, se devolverá un mensaje de error. |
|
Se ha realizado correctamente
|
IsSuccessful | boolean |
Si el texto se ha coinciden correctamente |
|
Información de licencia
|
LicenceInfo | string |
Información sobre la clave de suscripción de API |
|
Resultado del texto
|
TextResult | string |
Cadena generada a partir de la aplicación del texto extraído a la plantilla de resultado de texto proporcionada. Tenga en cuenta que si el recuento de páginas es mayor que uno concatenará todas las páginas mediante el separador de páginas. |
|
Results
|
TextResults | array of object |
Matriz que contiene una lista de páginas y los valores de texto extraídos |
|
(Número de página)
|
TextResults.pageNumber | string |
Página donde se encontró el texto |
|
(Texto de página)
|
TextResults.valueExtracted | string |
Cadena generada a partir de la aplicación del texto extraído a la plantilla de resultado de texto proporcionada. |
|
(Valores de zona)
|
TextResults.zoneValues | array of string |
Matriz que contiene el texto extraído de cada zona. |
ApiRenameByBarcodePost200ApplicationJsonResponse
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Código de barras
|
BarcodeResult | string |
Cadena generada a partir de la aplicación del texto extraído a la plantilla de resultado de código de barras proporcionada. Tenga en cuenta que si el recuento de páginas es mayor que uno concatenará todas las páginas mediante el separador de páginas. |
|
Results
|
BarcodeResults | array of object |
Matriz que contiene una lista de páginas y los valores de código de barras extraídos |
|
(Número de página)
|
BarcodeResults.pageNumber | string |
Página donde se encontró el código de barras |
|
(Código de barras de página)
|
BarcodeResults.valueExtracted | string |
Cadena generada a partir de la aplicación del valor de código de barras extraído a la plantilla de resultado de código de barras proporcionada. |
|
(Valores de zona)
|
BarcodeResults.zoneValues | array of string |
Matriz que contiene el código de barras extraído de cada zona. |
|
Mensaje de error
|
ErrorMessage | string |
Si el valor de Is Successful es false, se devolverá un mensaje de error. |
|
Se ha realizado correctamente
|
IsSuccessful | boolean |
Si se detectó un código de barras |
|
Información de licencia
|
LicenceInfo | string |
Información sobre la clave de suscripción de API |
ApiSplitPost200ApplicationJsonResponse
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Mensaje de error
|
ErrorMessage | string |
Si el valor de Is Successful es false, se devolverá un mensaje de error. |
|
Se ha realizado correctamente
|
IsSuccessful | boolean |
Esto devolverá true si se ha coinciden al menos una página dividida. |
|
Información de licencia
|
LicenceInfo | string |
Información sobre la clave de suscripción de API |
|
Dividir archivos de salida
|
SplittedFile | array of object |
Matriz que contiene cada uno de los archivos divididos junto con detalles como el nombre de archivo generado y el número de página. |
|
(Contenido del archivo)
|
SplittedFile.SplitFileContent | byte |
Cadena base 64 que representa el contenido del archivo |
|
(Nombre de archivo)
|
SplittedFile.SplitFileName | string |
Cadena que contiene el nombre de archivo generado |
|
(Intervalo de páginas)
|
SplittedFile.pageNumber | string |
Intervalo de páginas que contiene los números de página de la operación de división |
GetPDFInfoResponse
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Permitir ensamblado
|
AllowAssembly | boolean |
Permite la rotación, inserción o eliminación de páginas. |
|
Permitir impresión degradada
|
AllowDegradedPrinting | boolean |
Permitir impresión de baja calidad. |
|
Permitir extraer contenido
|
AllowExtractContents | boolean |
Permitir la extracción de texto y gráficos. |
|
Permitir extracción para accesibilidad
|
AllowExtractForAccessibility | boolean |
Permite la extracción de texto y gráficos compatibles con la accesibilidad. |
|
Permitir rellenar formulario
|
AllowFillInForm | boolean |
Permitir el llenado de campos de formulario. |
|
Permitir modificar anotaciones
|
AllowModifyAnnotations | boolean |
Permitir la modificación de anotaciones. |
|
Permitir modificar contenido
|
AllowModifyContents | boolean |
Permitir la modificación del contenido. |
|
Permitir impresión
|
AllowPrinting | boolean |
Permitir impresión de alta calidad. |
|
Autor
|
Author | string |
Quién creó el documento. |
|
Fecha de creación
|
CreationDate | string |
Esta es la fecha y hora en que se creó el PDF. |
|
Creador
|
Creator | string |
La aplicación o biblioteca de origen. |
|
Mensaje de error
|
ErrorMessage | string |
Si el valor de Is Successful es false, se devolverá un mensaje de error. |
|
Tamaño de archivo (bytes)
|
FileSize | number |
Tamaño del archivo en bytes |
|
Tiene texto oculto
|
HasHiddenText | boolean |
Esto devolverá true si el archivo PDF tiene una capa de OCR. |
|
Is Encrypted
|
IsEncrypted | boolean |
Esto devolverá true si este documento está cifrado o no. |
|
Se puede buscar
|
IsSearchable | boolean |
Esto devolverá true si el archivo PDF se puede buscar. |
|
Se ha realizado correctamente
|
IsSuccessful | boolean |
Devuelve true si la acción se realizó correctamente. |
|
Palabras clave
|
Keywords | string |
Las palabras clave pueden estar separadas por comas. |
|
Información de licencia
|
LicenceInfo | string |
Resumen json de la cuota de suscripción. |
|
Fecha de modificación
|
ModifiedDate | string |
Esta propiedad representa la fecha y hora en que se modificó por última vez el PDF. |
|
Número de páginas
|
NumberofPages | integer |
Número de páginas del archivo PDF. |
|
Versión de PDF
|
PDFversion | number |
Versión de la especificación pdf en la que se creó el documento. |
|
Producer
|
Producer | string |
Producto que creó el PDF. En los primeros días de pdf, los usuarios usarían una aplicación Creator como Microsoft Word para escribir un documento, imprimirlo en un archivo PostScript y, a continuación, el productor sería Acrobat Distiller, la aplicación que convirtió el archivo PostScript en un PDF. Hoy en día Creador y Productor a menudo son los mismos o un campo se deja en blanco. |
|
Asunto
|
Subject | string |
Sobre qué consiste el documento. |
|
Title
|
Title | string |
El título del documento. |
|
Atrapado
|
Trapped | string |
Esta propiedad es un valor booleano que indica si el documento se ha atrapado. La captura es un proceso previo a la presión que introduce áreas de color en separaciones de color para ocultar posibles errores de registro. |
|
Metadatos XMP
|
XmpMetadata | string |
La Plataforma extensible de metadatos (XMP) es un estándar ISO creado originalmente por Adobe Systems Inc., para la creación, el procesamiento y el intercambio de metadatos estandarizados y personalizados para documentos digitales y conjuntos de datos. |
ocr_response
Datos de respuesta para la operación OCR
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Mensaje de error
|
ErrorMessage | string |
Si el valor de Is Successful es false, se devolverá un mensaje de error. |
|
Se ha realizado correctamente
|
IsSuccessful | boolean |
Devuelve true si el OCR se realizó correctamente. |
|
Información de licencia
|
LicenceInfo | string |
Información sobre la clave de suscripción de API |
|
Contenido del archivo de registro
|
LogFileContent | byte |
Contenido del registro de la operación |
|
Contenido de archivo procesado
|
OutputFileContent | byte |
Archivo generado por el convertidor aquaforest PDF. |