Compartir a través de


Nutriente - Extracto de PDF (versión preliminar)

Desbloquea potentes acciones de extracción de datos y texto PDF con El convertidor de documentos nutrientes. Recupere sin problemas texto, datos, extraiga pares clave-valor y aproveche la tecnología OCR para procesar documentos escaneados. Ideal para indexación, búsqueda, análisis de contenido y flujos de trabajo de datos estructurados.

Este conector está disponible en los siguientes productos y regiones:

Service Class Regions
Copilot Studio Premium Todas las regiones de Power Automate excepto las siguientes:
     - Gobierno de EE. UU. (GCC)
     - Gobierno de EE. UU. (GCC High)
     - China Cloud operado por 21Vianet
     - Departamento de Defensa de EE. UU. (DoD)
Aplicaciones lógicas Estándar Todas las regiones de Logic Apps excepto las siguientes:
     - Regiones de Azure Government
     - Regiones de Azure China
     - Departamento de Defensa de EE. UU. (DoD)
Power Apps Premium Todas las regiones de Power Apps excepto las siguientes:
     - Gobierno de EE. UU. (GCC)
     - Gobierno de EE. UU. (GCC High)
     - China Cloud operado por 21Vianet
     - Departamento de Defensa de EE. UU. (DoD)
Power Automate Premium Todas las regiones de Power Automate excepto las siguientes:
     - Gobierno de EE. UU. (GCC)
     - Gobierno de EE. UU. (GCC High)
     - China Cloud operado por 21Vianet
     - Departamento de Defensa de EE. UU. (DoD)
Contacto
Nombre Soporte de nutrientes (anteriormente Muhimbi)
URL https://support.nutrient.io/hc/en-us/requests/new
Correo Electrónico support+low-code@nutrient.io
Metadatos del conector
Publicador Muhimbi negociando como nutriente
Sitio web https://www.nutrient.io/low-code/
Directiva de privacidad https://www.nutrient.io/legal/privacy/
Categorías Colaboración; Contenido y archivos

Extracción de texto y datos de archivos PDF

El convertidor de documentos nutrientes le permite extraer texto, datos o páginas específicas de archivos PDF como parte de flujos de trabajo automatizados en Power Automate. También puede extraer texto de imágenes mediante OCR.

Acciones disponibles

Consulte las guías vinculadas para obtener instrucciones paso a paso sobre cómo implementar estas acciones en los flujos de trabajo.

Prerrequisitos

Para usar El convertidor de documentos de Nutrientes, necesita una cuenta gratuita o de evaluación . Consulte la guía de comparación para comprender las diferencias entre estos tipos de cuenta.

Cómo empezar

Siga los pasos que se indican a continuación para empezar a usar el conector De convertidor de documentos de Nutrientes:

Problemas y limitaciones conocidos

Los documentos protegidos con soluciones IRM, DRM, RMS o AIP no se pueden procesar debido a restricciones de seguridad.

Para preguntas o ayuda, póngase en contacto con nuestro equipo de soporte técnico.

Limitaciones

Nombre Llamadas Período de renovación
Llamadas API por conexión 100 60 segundos

Acciones

Extracción de pares clave-valor de un documento PDF

Identifique y extraiga pares clave-valor de documentos para procesar formularios o flujos de trabajo de datos estructurados.

Extracción de texto de un archivo PDF mediante OCR

Extraiga texto de documentos o imágenes escaneados mediante la tecnología OCR, lo que hace que se puedan buscar y editar.

Extracción de texto de un documento PDF

Recupere contenido de texto de documentos PDF para facilitar la indexación, la búsqueda o el análisis de contenido.

Extracción de pares clave-valor de un documento PDF

Identifique y extraiga pares clave-valor de documentos para procesar formularios o flujos de trabajo de datos estructurados.

Parámetros

Nombre Clave Requerido Tipo Description
Nombre del archivo de origen
source_file_name True string

Nombre del archivo de origen, incluida la extensión

Contenido del archivo de origen
source_file_content True byte

Contenido del archivo que se va a convertir

Lenguaje OCR
ocr_language string

Códigos de idioma para la extracción de OCR y KVP, separados por "+". Por ejemplo, "eng+deu+fra" agregaría inglés, alemán y francés.

PPP
dpi enum

Quitar las páginas en blanco en el PDF

Formato de salida KVP
kvp_format enum

Formatos de salida separados por comas. Los datos KVP se pueden generar en JSON, CSV y XML. e.g. json,csv,xml

Intervalo de páginas
page_range string

Las páginas que va a procesar KVP. Utilice la cadena de "1 - 5" para las páginas 1 a 5, o use la cadena de "1, 5, 6" para especificar las páginas 1 y 5 y 6.

Autorotate
autorotate enum

Si el texto no tiene la orientación correcta, si el texto no tiene la orientación correcta, se rotará automáticamente en las páginas.

Recortar símbolos
trim_symbols enum

Si se establece en "Sí", se quitarán los símbolos del inicio o final de los valores, con la excepción de los símbolos hash '#' o punto '.'.

Incluir rectángulo de límite de clave
include_key_bounding_box enum

Incluir los valores del cuadro de límite para la clave en la salida

Incluir rectángulo de selección de valores
include_value_bounding_box enum

Incluir los valores del rectángulo de límite para el valor de la salida

Incluir número de página
include_page_number enum

Incluir el número de página para el par de valores de clave en la salida

Incluir confianza
include_confidence enum

Incluya la puntuación de confianza para el par clave-valor en la salida. La confianza se mide entre 0 (sin confianza) y 100 (plena confianza).

Umbral de confianza
confidence_threshold integer

El umbral de confianza que debe alcanzar un par de valores de clave debe incluirse en la salida. Los resultados bajo el umbral se descartan.

Tipo de inclusión
include_type enum

Incluir el tipo de datos para el par de valores de clave en la salida

Claves esperadas
expected_keys string

Cadena JSON que contiene las claves y sinónimos esperados

Error
fail_on_error boolean

Error

Devoluciones

Datos de respuesta para todas las operaciones

Extracción de texto de un archivo PDF mediante OCR

Extraiga texto de documentos o imágenes escaneados mediante la tecnología OCR, lo que hace que se puedan buscar y editar.

Parámetros

Nombre Clave Requerido Tipo Description
Nombre del archivo de origen
source_file_name True string

Nombre del archivo de origen, incluida la extensión

Contenido del archivo de origen
source_file_content True byte

Contenido del archivo en OCR

Language
language enum

Language

Coordenada X
x string

Coordenada X (en Pts, 1/72 de pulgada)

Coordenada Y
y string

Coordenada Y (en Pts, 1/72 de pulgada)

Ancho
width string

Ancho del área OCR (en Pts, 1/72 de pulgada)

Altura
height string

Alto del área de OCR (en Pts, 1/72 de pulgada)

Número de página
page_number string

Número de página (deje en blanco en OCR todas las páginas)

Performance
performance enum

Rendimiento ()

Lista negra/lista blanca
characters_option enum

Opción Caracteres

Caracteres
characters string

Caracteres a la lista negra o a la lista blanca

Uso de la paginación
paginate boolean

Paginar

Error
fail_on_error boolean

Error

Devoluciones

Datos de respuesta para la operación OCRText

Extracción de texto de un documento PDF

Recupere contenido de texto de documentos PDF para facilitar la indexación, la búsqueda o el análisis de contenido.

Parámetros

Nombre Clave Requerido Tipo Description
Nombre del archivo de origen
source_file_name True string

Nombre del archivo de origen, incluida la extensión

Contenido del archivo de origen
source_file_content True byte

Contenido del archivo que se va a convertir

Intervalo de páginas
page_range string

Intervalo de páginas para extraer texto de, por ejemplo, 1,5,8-12

Error
fail_on_error boolean

Error

Devoluciones

Datos de respuesta para todas las operaciones

Definiciones

ocr_operation_response

Datos de respuesta para la operación OCRText

Nombre Ruta de acceso Tipo Description
Texto fuera
out_text string

Texto OCRed extraído en texto sin formato.

Nombre de archivo base
base_file_name string

Nombre del archivo de entrada sin la extensión .

Código de resultado
result_code enum

Código de resultado de la operación.

Detalles del resultado
result_details string

Detalles del resultado de la operación.

operation_response

Datos de respuesta para todas las operaciones

Nombre Ruta de acceso Tipo Description
Contenido de archivo procesado
processed_file_content byte

Archivo generado por el convertidor Muhimbi.

Nombre de archivo base
base_file_name string

Nombre del archivo de entrada sin la extensión .

Código de resultado
result_code enum

Código de resultado de la operación.

Detalles del resultado
result_details string

Detalles del resultado de la operación.