Nutriente - Extracto de PDF (versión preliminar)
Desbloquea potentes acciones de extracción de datos y texto PDF con El convertidor de documentos nutrientes. Recupere sin problemas texto, datos, extraiga pares clave-valor y aproveche la tecnología OCR para procesar documentos escaneados. Ideal para indexación, búsqueda, análisis de contenido y flujos de trabajo de datos estructurados.
Este conector está disponible en los siguientes productos y regiones:
| Service | Class | Regions |
|---|---|---|
| Copilot Studio | Premium | Todas las regiones de Power Automate excepto las siguientes: - Gobierno de EE. UU. (GCC) - Gobierno de EE. UU. (GCC High) - China Cloud operado por 21Vianet - Departamento de Defensa de EE. UU. (DoD) |
| Aplicaciones lógicas | Estándar | Todas las regiones de Logic Apps excepto las siguientes: - Regiones de Azure Government - Regiones de Azure China - Departamento de Defensa de EE. UU. (DoD) |
| Power Apps | Premium | Todas las regiones de Power Apps excepto las siguientes: - Gobierno de EE. UU. (GCC) - Gobierno de EE. UU. (GCC High) - China Cloud operado por 21Vianet - Departamento de Defensa de EE. UU. (DoD) |
| Power Automate | Premium | Todas las regiones de Power Automate excepto las siguientes: - Gobierno de EE. UU. (GCC) - Gobierno de EE. UU. (GCC High) - China Cloud operado por 21Vianet - Departamento de Defensa de EE. UU. (DoD) |
| Contacto | |
|---|---|
| Nombre | Soporte de nutrientes (anteriormente Muhimbi) |
| URL | https://support.nutrient.io/hc/en-us/requests/new |
| Correo Electrónico | support+low-code@nutrient.io |
| Metadatos del conector | |
|---|---|
| Publicador | Muhimbi negociando como nutriente |
| Sitio web | https://www.nutrient.io/low-code/ |
| Directiva de privacidad | https://www.nutrient.io/legal/privacy/ |
| Categorías | Colaboración; Contenido y archivos |
Extracción de texto y datos de archivos PDF
El convertidor de documentos nutrientes le permite extraer texto, datos o páginas específicas de archivos PDF como parte de flujos de trabajo automatizados en Power Automate. También puede extraer texto de imágenes mediante OCR.
Acciones disponibles
- Extracción de pares clave-valor
- Extracción de texto mediante OCR
- Extracción de datos de archivos PDF
- Extracción de páginas PDF
- Extraer texto de imágenes
- Extracción de texto de archivos PDF mediante Power Automate
Consulte las guías vinculadas para obtener instrucciones paso a paso sobre cómo implementar estas acciones en los flujos de trabajo.
Prerrequisitos
Para usar El convertidor de documentos de Nutrientes, necesita una cuenta gratuita o de evaluación . Consulte la guía de comparación para comprender las diferencias entre estos tipos de cuenta.
Cómo empezar
Siga los pasos que se indican a continuación para empezar a usar el conector De convertidor de documentos de Nutrientes:
- Regístrese para obtener una prueba de 30 días rellenando este formulario.
- Después de enviar el formulario, recibirá un correo electrónico con los detalles de activación de prueba.
- Consulte el vídeo de introducción para ver un tutorial del proceso.
- Lea la guía de Document Converter for Power Automate para obtener instrucciones detalladas.
- Explore los tutoriales de Power Automate y Logic Apps para obtener ejemplos prácticos.
Problemas y limitaciones conocidos
Los documentos protegidos con soluciones IRM, DRM, RMS o AIP no se pueden procesar debido a restricciones de seguridad.
Para preguntas o ayuda, póngase en contacto con nuestro equipo de soporte técnico.
Limitaciones
| Nombre | Llamadas | Período de renovación |
|---|---|---|
| Llamadas API por conexión | 100 | 60 segundos |
Acciones
| Extracción de pares clave-valor de un documento PDF |
Identifique y extraiga pares clave-valor de documentos para procesar formularios o flujos de trabajo de datos estructurados. |
| Extracción de texto de un archivo PDF mediante OCR |
Extraiga texto de documentos o imágenes escaneados mediante la tecnología OCR, lo que hace que se puedan buscar y editar. |
| Extracción de texto de un documento PDF |
Recupere contenido de texto de documentos PDF para facilitar la indexación, la búsqueda o el análisis de contenido. |
Extracción de pares clave-valor de un documento PDF
Identifique y extraiga pares clave-valor de documentos para procesar formularios o flujos de trabajo de datos estructurados.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Nombre del archivo de origen
|
source_file_name | True | string |
Nombre del archivo de origen, incluida la extensión |
|
Contenido del archivo de origen
|
source_file_content | True | byte |
Contenido del archivo que se va a convertir |
|
Lenguaje OCR
|
ocr_language | string |
Códigos de idioma para la extracción de OCR y KVP, separados por "+". Por ejemplo, "eng+deu+fra" agregaría inglés, alemán y francés. |
|
|
PPP
|
dpi | enum |
Quitar las páginas en blanco en el PDF |
|
|
Formato de salida KVP
|
kvp_format | enum |
Formatos de salida separados por comas. Los datos KVP se pueden generar en JSON, CSV y XML. e.g. json,csv,xml |
|
|
Intervalo de páginas
|
page_range | string |
Las páginas que va a procesar KVP. Utilice la cadena de "1 - 5" para las páginas 1 a 5, o use la cadena de "1, 5, 6" para especificar las páginas 1 y 5 y 6. |
|
|
Autorotate
|
autorotate | enum |
Si el texto no tiene la orientación correcta, si el texto no tiene la orientación correcta, se rotará automáticamente en las páginas. |
|
|
Recortar símbolos
|
trim_symbols | enum |
Si se establece en "Sí", se quitarán los símbolos del inicio o final de los valores, con la excepción de los símbolos hash '#' o punto '.'. |
|
|
Incluir rectángulo de límite de clave
|
include_key_bounding_box | enum |
Incluir los valores del cuadro de límite para la clave en la salida |
|
|
Incluir rectángulo de selección de valores
|
include_value_bounding_box | enum |
Incluir los valores del rectángulo de límite para el valor de la salida |
|
|
Incluir número de página
|
include_page_number | enum |
Incluir el número de página para el par de valores de clave en la salida |
|
|
Incluir confianza
|
include_confidence | enum |
Incluya la puntuación de confianza para el par clave-valor en la salida. La confianza se mide entre 0 (sin confianza) y 100 (plena confianza). |
|
|
Umbral de confianza
|
confidence_threshold | integer |
El umbral de confianza que debe alcanzar un par de valores de clave debe incluirse en la salida. Los resultados bajo el umbral se descartan. |
|
|
Tipo de inclusión
|
include_type | enum |
Incluir el tipo de datos para el par de valores de clave en la salida |
|
|
Claves esperadas
|
expected_keys | string |
Cadena JSON que contiene las claves y sinónimos esperados |
|
|
Error
|
fail_on_error | boolean |
Error |
Devoluciones
Datos de respuesta para todas las operaciones
- Body
- operation_response
Extracción de texto de un archivo PDF mediante OCR
Extraiga texto de documentos o imágenes escaneados mediante la tecnología OCR, lo que hace que se puedan buscar y editar.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Nombre del archivo de origen
|
source_file_name | True | string |
Nombre del archivo de origen, incluida la extensión |
|
Contenido del archivo de origen
|
source_file_content | True | byte |
Contenido del archivo en OCR |
|
Language
|
language | enum |
Language |
|
|
Coordenada X
|
x | string |
Coordenada X (en Pts, 1/72 de pulgada) |
|
|
Coordenada Y
|
y | string |
Coordenada Y (en Pts, 1/72 de pulgada) |
|
|
Ancho
|
width | string |
Ancho del área OCR (en Pts, 1/72 de pulgada) |
|
|
Altura
|
height | string |
Alto del área de OCR (en Pts, 1/72 de pulgada) |
|
|
Número de página
|
page_number | string |
Número de página (deje en blanco en OCR todas las páginas) |
|
|
Performance
|
performance | enum |
Rendimiento () |
|
|
Lista negra/lista blanca
|
characters_option | enum |
Opción Caracteres |
|
|
Caracteres
|
characters | string |
Caracteres a la lista negra o a la lista blanca |
|
|
Uso de la paginación
|
paginate | boolean |
Paginar |
|
|
Error
|
fail_on_error | boolean |
Error |
Devoluciones
Datos de respuesta para la operación OCRText
Extracción de texto de un documento PDF
Recupere contenido de texto de documentos PDF para facilitar la indexación, la búsqueda o el análisis de contenido.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Nombre del archivo de origen
|
source_file_name | True | string |
Nombre del archivo de origen, incluida la extensión |
|
Contenido del archivo de origen
|
source_file_content | True | byte |
Contenido del archivo que se va a convertir |
|
Intervalo de páginas
|
page_range | string |
Intervalo de páginas para extraer texto de, por ejemplo, 1,5,8-12 |
|
|
Error
|
fail_on_error | boolean |
Error |
Devoluciones
Datos de respuesta para todas las operaciones
- Body
- operation_response
Definiciones
ocr_operation_response
Datos de respuesta para la operación OCRText
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Texto fuera
|
out_text | string |
Texto OCRed extraído en texto sin formato. |
|
Nombre de archivo base
|
base_file_name | string |
Nombre del archivo de entrada sin la extensión . |
|
Código de resultado
|
result_code | enum |
Código de resultado de la operación. |
|
Detalles del resultado
|
result_details | string |
Detalles del resultado de la operación. |
operation_response
Datos de respuesta para todas las operaciones
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Contenido de archivo procesado
|
processed_file_content | byte |
Archivo generado por el convertidor Muhimbi. |
|
Nombre de archivo base
|
base_file_name | string |
Nombre del archivo de entrada sin la extensión . |
|
Código de resultado
|
result_code | enum |
Código de resultado de la operación. |
|
Detalles del resultado
|
result_details | string |
Detalles del resultado de la operación. |