Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Content Understanding ofrece funcionalidades sofisticadas de análisis de documentos. Las organizaciones pueden usar estas funcionalidades para convertir el contenido no estructurado en datos accionables y organizados. Content Understanding puede usar analizadores personalizables para extraer de forma experta información esencial, campos y relaciones de una amplia gama de documentos y formularios.
Casos de uso empresarial
Los analizadores de documentos pueden procesar documentos complejos en varios formatos y plantillas:
- Administración del ciclo de vida del contrato: Extraiga campos clave, cláusulas y obligaciones de varios tipos de contrato.
- Préstamos e hipotecas: Automatice el procesamiento para permitir un control más rápido por parte de los bancos, los prestamistas y las entidades gubernamentales.
- Servicios financieros: Analice documentos complejos, como informes financieros e informes de administración de activos.
- Administración de gastos: Analice recibos y facturas de varios minoristas para validar los gastos en diferentes formatos y plantillas.
- Conjuntos de documentos y escenarios de base de conocimiento: Extraiga campos clave de conjuntos de documentos como un todo. Agregue datos de referencia que controle tareas como validación y enriquecimiento aplicando el razonamiento de varios pasos.
Ventajas clave
Content Understanding ofrece eficaces funcionalidades de análisis de documentos diseñadas para abordar escenarios empresariales y empresariales críticos, como RAG y automatización de procesos robóticos. Entre las ventajas clave se incluyen las siguientes:
- Habilitación de búsqueda inteligente: Transforme documentos no estructurados en recursos de datos estructurados y buscables para mejorar la detectabilidad y accesibilidad de la información en toda la organización.
- Extracción de datos fundamentada: Mantener una rastreabilidad clara y la localización de los datos extraídos para facilitar procesos de revisión con intervención humana y garantizar la transparencia y el cumplimiento.
- Automatización controlada por confianza: Use la puntuación de confianza integrada para automatizar de forma inteligente las tareas de procesamiento de documentos para ayudarle a optimizar la asignación de recursos, reducir los costos operativos y mejorar la precisión de la toma de decisiones.
- Personalización flexible: Adapte y ajuste fácilmente los analizadores de documentos para que se adapten a los procesos empresariales y flujos de trabajo específicos. La personalización permite una extracción y clasificación precisas adaptadas a los requisitos específicos de su organización.
- Precisión y confiabilidad mejoradas: Lograr una extracción y clasificación precisas de datos empresariales críticos para reducir los errores y mejorar la eficacia operativa en los flujos de trabajo automatizados.
-
Agentes listos: Procese la entrada diversa y entregue la salida en un formato estándar que esté listo para el flujo de trabajo de un agente. Las salidas pueden proporcionar a tu aplicación una comprensión de la intención del usuario, con datos respaldados por un
strongly-typedesquema que facilita la obtención rápida de datos en un formato listo para tu código.
Funcionalidades del analizador de documentos
Extracción de contenido
La extracción de contenido constituye la base de las funcionalidades de análisis de documentos de Content Understanding. Este proceso transforma documentos no estructurados en datos estructurados y legibles por máquina. La extracción de contenido captura de forma precisa texto impreso y manuscrito mientras conserva la estructura del documento a través del análisis avanzado del diseño:
- Análisis de contenido
- Texto: procesa contenido multilingüe, incluido texto impreso por máquina y manuscrito de cientos de idiomas.
- Marcas de selección: identifica y extrae indicadores de selección como casillas, botones y marcadores similares.
- Detección de códigos de barras: escanea y descodifica información de más de una docena de tipos de códigos de barras lineales y bidimensionales.
- Fórmulas matemáticas: captura y conserva expresiones matemáticas complejas en formato LaTeX.
- Elementos de imagen: localiza y extrae imágenes, ilustraciones, diagramas y gráficos junto con sus títulos y anotaciones relacionados.
- Elementos hyperlink: detecta hipervínculos incrustados en el documento.
- Elementos de anotación: asocia los contenidos con sus anotaciones como tachado, subrayado y resaltado.
- Elementos de figura: detecta y extrae elementos de figura en un formato estructurado.
- Análisis de estructura
- Párrafos: detecta y clasifica los segmentos de texto en función del contexto y el rol del documento.
- Datos tabulares: reconoce y extrae estructuras de tabla, incluidos formatos complejos con celdas de expansión y diseños de varias páginas.
- Secciones jerárquicas: asigna la organización del contenido a través de encabezados de sección y relaciones de contenido anidadas.
- Generación aumentada de recuperación (RAG)
- Soluciones RAG: La extracción de contenido forma la base de sistemas RAG eficaces mediante la transformación de datos multimodales sin procesar en formatos estructurados y optimizados para la búsqueda y recuperación. Para más información sobre la creación de soluciones RAG, consulte Generación aumentada de recuperación.
Extracción de campos
Con la extracción de campos, puede extraer, clasificar y generar datos estructurados de varios documentos y formularios personalizados para satisfacer sus requisitos. El proceso de transformación de contenido no estructurado en información organizada y accionable simplifica la administración de datos, mejora la capacidad de búsqueda y admite flujos de trabajo automatizados.
Por ejemplo, puede extraer sin problemas los detalles del cliente, las direcciones de facturación y los cargos detallados de las facturas. También puede identificar partes contractuales, fechas de renovación y términos de pago en acuerdos legales. Para maximizar la eficacia, puede usar plantillas de analizador precompiladas, como plantillas adaptadas para facturas. También puede diseñar analizadores personalizados desde cero para mejorar la precisión mediante el etiquetado de más documentos de ejemplo.
La API de confianza y fundamento es una característica de participación. Para participar en la confianza y el fundamento para la extracción de campos, configure estimateFieldSourceAndConfidence = true en la configuración del analizador o estimateSourceAndConfidence = true para un campo específico.
Métodos de extracción de campos
Content Understanding proporciona métodos versátiles para la extracción de campos, lo que permite un procesamiento preciso y adaptado del contenido del documento:
- Extraer: extraiga datos específicos, como fechas de transacción de recibos o elementos de línea de facturas, para una captura de información precisa y centrada.
- Clasificar: clasifique el contenido del documento en categorías predefinidas, como clasificar opiniones en transcripciones de llamadas de cliente o clasificar elementos de recibo de hotel.
- Generar: genere nuevos resúmenes o conclusiones de los documentos, incluidos resúmenes de documentos e información general de capítulos para mejorar la accesibilidad y comprensión del contenido.
Requisitos de entrada
Para obtener más información sobre los formatos de documento de entrada admitidos, consulte Cuotas y límites de servicio.
Idiomas y regiones admitidos
Para obtener una lista de los idiomas y regiones admitidos, consulte Compatibilidad con idiomas y regiones.
Datos, privacidad y seguridad
Los desarrolladores que usan Content Understanding deben revisar las directivas de Microsoft en los datos de los clientes. Para obtener más información, consulte Datos, privacidad y seguridad.
Contenido relacionado
- Pruebe a procesar el contenido del documento mediante Content Understanding Studio.
- Consulte el inicio rápido de Content Understanding Studio.
- Aprenda a analizar el contenido del documento mediante plantillas de analizador.
- Revise los ejemplos de código con la búsqueda de documentos visuales.