Nutriente - Extracto de PDF (versión preliminar)

Desbloquea potentes acciones de extracción de datos y texto PDF con El convertidor de documentos nutrientes. Recupere sin problemas texto, datos, extraiga pares clave-valor y aproveche la tecnología OCR para procesar documentos escaneados. Ideal para indexación, búsqueda, análisis de contenido y flujos de trabajo de datos estructurados.

Este conector está disponible en los siguientes productos y regiones:

Service	Class	Regions
Copilot Studio	Premium	Todas las regiones de Power Automate excepto las siguientes: - Gobierno de EE. UU. (GCC) - Gobierno de EE. UU. (GCC High) - China Cloud operado por 21Vianet - Departamento de Defensa de EE. UU. (DoD)
Aplicaciones lógicas	Estándar	Todas las regiones de Logic Apps excepto las siguientes: - Regiones de Azure Government - Regiones de Azure China - Departamento de Defensa de EE. UU. (DoD)
Power Apps	Premium	Todas las regiones de Power Apps excepto las siguientes: - Gobierno de EE. UU. (GCC) - Gobierno de EE. UU. (GCC High) - China Cloud operado por 21Vianet - Departamento de Defensa de EE. UU. (DoD)
Power Automate	Premium	Todas las regiones de Power Automate excepto las siguientes: - Gobierno de EE. UU. (GCC) - Gobierno de EE. UU. (GCC High) - China Cloud operado por 21Vianet - Departamento de Defensa de EE. UU. (DoD)

Contacto
Nombre	Soporte de nutrientes (anteriormente Muhimbi)
URL	https://support.nutrient.io/hc/en-us/requests/new
Correo Electrónico	support+low-code@nutrient.io

Metadatos del conector
Publicador	Muhimbi negociando como nutriente
Sitio web	https://www.nutrient.io/low-code/
Directiva de privacidad	https://www.nutrient.io/legal/privacy/
Categorías	Colaboración; Contenido y archivos

Extracción de texto y datos de archivos PDF

El convertidor de documentos nutrientes le permite extraer texto, datos o páginas específicas de archivos PDF como parte de flujos de trabajo automatizados en Power Automate. También puede extraer texto de imágenes mediante OCR.

Acciones disponibles

Consulte las guías vinculadas para obtener instrucciones paso a paso sobre cómo implementar estas acciones en los flujos de trabajo.

Prerrequisitos

Para usar El convertidor de documentos de Nutrientes, necesita una cuenta gratuita o de evaluación . Consulte la guía de comparación para comprender las diferencias entre estos tipos de cuenta.

Cómo empezar

Siga los pasos que se indican a continuación para empezar a usar el conector De convertidor de documentos de Nutrientes:

Regístrese para obtener una prueba de 30 días rellenando este formulario.
Después de enviar el formulario, recibirá un correo electrónico con los detalles de activación de prueba.
Consulte el vídeo de introducción para ver un tutorial del proceso.
Lea la guía de Document Converter for Power Automate para obtener instrucciones detalladas.
Explore los tutoriales de Power Automate y Logic Apps para obtener ejemplos prácticos.

Problemas y limitaciones conocidos

Los documentos protegidos con soluciones IRM, DRM, RMS o AIP no se pueden procesar debido a restricciones de seguridad.

Para preguntas o ayuda, póngase en contacto con nuestro equipo de soporte técnico.

Limitaciones

Nombre	Llamadas	Período de renovación
Llamadas API por conexión	100	60 segundos

Acciones

Extracción de pares clave-valor de un documento PDF	Identifique y extraiga pares clave-valor de documentos para procesar formularios o flujos de trabajo de datos estructurados.
Extracción de texto de un archivo PDF mediante OCR	Extraiga texto de documentos o imágenes escaneados mediante la tecnología OCR, lo que hace que se puedan buscar y editar.
Extracción de texto de un documento PDF	Recupere contenido de texto de documentos PDF para facilitar la indexación, la búsqueda o el análisis de contenido.

Extracción de pares clave-valor de un documento PDF

Id. de la operación:: extract_key_value_pairs

Identifique y extraiga pares clave-valor de documentos para procesar formularios o flujos de trabajo de datos estructurados.

Parámetros

Nombre	Clave	Requerido	Tipo	Description
Nombre del archivo de origen	source_file_name	True	string	Nombre del archivo de origen, incluida la extensión
Contenido del archivo de origen	source_file_content	True	byte	Contenido del archivo que se va a convertir
Lenguaje OCR	ocr_language		string	Códigos de idioma para la extracción de OCR y KVP, separados por "+". Por ejemplo, "eng+deu+fra" agregaría inglés, alemán y francés.
PPP	dpi		enum	Quitar las páginas en blanco en el PDF
Formato de salida KVP	kvp_format		enum	Formatos de salida separados por comas. Los datos KVP se pueden generar en JSON, CSV y XML. e.g. json,csv,xml
Intervalo de páginas	page_range		string	Las páginas que va a procesar KVP. Utilice la cadena de "1 - 5" para las páginas 1 a 5, o use la cadena de "1, 5, 6" para especificar las páginas 1 y 5 y 6.
Autorotate	autorotate		enum	Si el texto no tiene la orientación correcta, si el texto no tiene la orientación correcta, se rotará automáticamente en las páginas.
Recortar símbolos	trim_symbols		enum	Si se establece en "Sí", se quitarán los símbolos del inicio o final de los valores, con la excepción de los símbolos hash '#' o punto '.'.
Incluir rectángulo de límite de clave	include_key_bounding_box		enum	Incluir los valores del cuadro de límite para la clave en la salida
Incluir rectángulo de selección de valores	include_value_bounding_box		enum	Incluir los valores del rectángulo de límite para el valor de la salida
Incluir número de página	include_page_number		enum	Incluir el número de página para el par de valores de clave en la salida
Incluir confianza	include_confidence		enum	Incluya la puntuación de confianza para el par clave-valor en la salida. La confianza se mide entre 0 (sin confianza) y 100 (plena confianza).
Umbral de confianza	confidence_threshold		integer	El umbral de confianza que debe alcanzar un par de valores de clave debe incluirse en la salida. Los resultados bajo el umbral se descartan.
Tipo de inclusión	include_type		enum	Incluir el tipo de datos para el par de valores de clave en la salida
Claves esperadas	expected_keys		string	Cadena JSON que contiene las claves y sinónimos esperados
Error	fail_on_error		boolean	Error

Devoluciones

Datos de respuesta para todas las operaciones

Body: operation_response

Extracción de texto de un archivo PDF mediante OCR

Id. de la operación:: ocr_text

Extraiga texto de documentos o imágenes escaneados mediante la tecnología OCR, lo que hace que se puedan buscar y editar.

Parámetros

Nombre	Clave	Requerido	Tipo	Description
Nombre del archivo de origen	source_file_name	True	string	Nombre del archivo de origen, incluida la extensión
Contenido del archivo de origen	source_file_content	True	byte	Contenido del archivo en OCR
Language	language		enum	Language
Coordenada X	x		string	Coordenada X (en Pts, 1/72 de pulgada)
Coordenada Y	y		string	Coordenada Y (en Pts, 1/72 de pulgada)
Ancho	width		string	Ancho del área OCR (en Pts, 1/72 de pulgada)
Altura	height		string	Alto del área de OCR (en Pts, 1/72 de pulgada)
Número de página	page_number		string	Número de página (deje en blanco en OCR todas las páginas)
Performance	performance		enum	Rendimiento ()
Lista negra/lista blanca	characters_option		enum	Opción Caracteres
Caracteres	characters		string	Caracteres a la lista negra o a la lista blanca
Uso de la paginación	paginate		boolean	Paginar
Error	fail_on_error		boolean	Error

Devoluciones

Datos de respuesta para la operación OCRText

Body: ocr_operation_response

Extracción de texto de un documento PDF

Id. de la operación:: extract_text

Recupere contenido de texto de documentos PDF para facilitar la indexación, la búsqueda o el análisis de contenido.

Parámetros

Nombre	Clave	Requerido	Tipo	Description
Nombre del archivo de origen	source_file_name	True	string	Nombre del archivo de origen, incluida la extensión
Contenido del archivo de origen	source_file_content	True	byte	Contenido del archivo que se va a convertir
Intervalo de páginas	page_range		string	Intervalo de páginas para extraer texto de, por ejemplo, 1,5,8-12
Error	fail_on_error		boolean	Error

Devoluciones

Datos de respuesta para todas las operaciones

Body: operation_response

Definiciones

ocr_operation_response

Datos de respuesta para la operación OCRText

Nombre	Ruta de acceso	Tipo	Description
Texto fuera	out_text	string	Texto OCRed extraído en texto sin formato.
Nombre de archivo base	base_file_name	string	Nombre del archivo de entrada sin la extensión .
Código de resultado	result_code	enum	Código de resultado de la operación.
Detalles del resultado	result_details	string	Detalles del resultado de la operación.

operation_response

Datos de respuesta para todas las operaciones

Nombre	Ruta de acceso	Tipo	Description
Contenido de archivo procesado	processed_file_content	byte	Archivo generado por el convertidor Muhimbi.
Nombre de archivo base	base_file_name	string	Nombre del archivo de entrada sin la extensión .
Código de resultado	result_code	enum	Código de resultado de la operación.
Detalles del resultado	result_details	string	Detalles del resultado de la operación.

Compartir a través de

Nutriente - Extracto de PDF (versión preliminar)

Extracción de texto y datos de archivos PDF

Acciones disponibles

Prerrequisitos

Cómo empezar

Problemas y limitaciones conocidos

Limitaciones

Acciones

Extracción de pares clave-valor de un documento PDF

Parámetros

Devoluciones

Extracción de texto de un archivo PDF mediante OCR

Parámetros

Devoluciones

Extracción de texto de un documento PDF

Parámetros

Devoluciones

Definiciones

ocr_operation_response

operation_response