Comprensión del contenido clasificación/segmentación

Content Understanding permite a los clientes implementar la clasificación y la división como parte de la solicitud de operación del analizador. Puede realizar la clasificación de contenido y la extracción de contenido como parte de una sola llamada API.

El concepto global de analyzer ahora incluye el concepto de contentCategories y enableSegment para clasificar y dividir los datos de entrada que procesa dentro de su aplicación. Esta característica del analizador puede realizar la clasificación de un archivo de entrada en su conjunto. También puede identificar varios documentos o varias instancias de un único documento dentro de un archivo de entrada.

A partir de la versión de disponibilidad general, el diseño de clasificación de documentos y segmentación de vídeo se unifican, lo que permite un enfoque coherente para procesar los datos de entrada independientemente de su modalidad. En la documentación, la "clasificación de Comprensión del Contenido" se refiere a las operaciones de análisis necesarias para clasificar y separar los datos de entrada (contentCategories y enableSegment).

Casos de uso empresarial

La clasificación de Content Understanding permite procesar documentos y vídeos complejos en varios formatos y plantillas:

Facturas: clasifique las facturas de varios proveedores para procesar cada categoría con un analizador de Content Understanding diferente, si es necesario.
Documentos fiscales: clasifique varios documentos fiscales en diferentes tipos de formularios fiscales, como 1040 y 1099.
Contratos: clasifique contratos largos y no estructurados para simplificar las operaciones para comprender los distintos tipos de acuerdos y sus implicaciones legales específicas.
Vídeo deportivo: segmente automáticamente las escenas para dividir el vídeo en fragmentos lógicos, como anuncios y el contenido deportivo real.

Funcionalidades de clasificación y segmentación

Content Understanding puede analizar documentos de uno o varios archivos para identificar si un archivo de entrada se puede clasificar en una categoría tal como se define. Se admiten los siguientes escenarios:

Escenarios de documento:

Clasificar solo: clasifica el archivo de entrada como un todo. Por ejemplo, un único archivo que contiene un tipo de documento, como un formulario de solicitud de préstamo.
Clasificar y analizar: clasifica y analiza el archivo de entrada mediante el enrutamiento de la entrada al analizador de extracción deseado.
Clasificar y segmentar: clasifica y segmenta un único archivo de entrada que podría tener varios tipos o instancias de documentos concatenados. Por ejemplo, un paquete de solicitud de préstamo que contiene un formulario de solicitud de préstamo, un recibo de pago y un extracto bancario. Otro ejemplo es una colección de facturas escaneadas en un único archivo.
Clasificar, segmentar y analizar: una vez clasificados los segmentos, enrute cada segmento al analizador de extracción deseado para una extracción de campos adicional.
Clasificador jerárquico: el análisis adicional opcional en función de la categoría también puede ser un analizador clasificador.

Escenarios de vídeo:

Solo segmento: divida el vídeo en segmentos en función de las características de contenido definidas en el description campo de contentCategories. Por ejemplo, dividir una difusión deportiva en segmentos de juego, comerciales y comentarios.
Segmentar y analizar: Dividir el vídeo en segmentos y encaminar cada segmento a un analizador para la extracción de campos.

Nota:

La unidad mínima para la clasificación de documentos es una sola página. No se admite la clasificación dentro de páginas.

Creación de categorías de clasificación

La clasificación de Content Understanding no requiere un conjunto de datos de entrenamiento. Puede definir hasta 200 nombres y descripciones de categorías dentro de la operación de análisis. De forma predeterminada, todo el archivo se trata como un único objeto de contenido, lo que significa que el archivo se asociará a una sola categoría.

A partir de la versión de disponibilidad general, debe incluir la categoría other dentro de contentCategories para asegurarse de que el contenido puede permanecer sin coincidir con ninguna de sus categorías definidas. Si no se incluye la other categoría, todos los archivos se ven obligados a clasificarse en una de las categorías definidas. Cada uno de los nombres de categoría que defina dentro de contentCategories también puede incluir un description para proporcionar más información sobre la categoría que está definiendo.

División de archivos de entrada

Cuando tiene más de un documento en un archivo, el clasificador puede identificar los distintos tipos de documento contenidos en el archivo de entrada con la funcionalidad de división. La respuesta del clasificador contiene los intervalos de páginas de cada uno de los tipos de documento identificados que se encuentran dentro de un archivo. Esta respuesta puede incluir varias instancias del mismo tipo de documento.

Al ejecutar la operación analyze, ahora incluye una propiedad enableSegment que proporciona un control detallado sobre el comportamiento de división. También puede especificar los números de página para analizar solo determinadas páginas del documento de entrada:

Para tratar todo el archivo de entrada como varios documentos combinados para la clasificación, establezca enableSegment en true. Al hacerlo, el servicio devuelve categorías para los segmentos del archivo de entrada automáticamente.
Para tratar todo el archivo de entrada como un único documento, establezca enableSegment en false.

Nota:

En el caso de los vídeos, solo se admite la segmentación. Debe definir un único contentCategories con enableSegment configurado en true. Use el description campo para especificar criterios para dividir el vídeo en segmentos.

Análisis opcional

Para obtener un flujo completo de un extremo a otro, puede vincular categorías de clasificadores con analizadores personalizados existentes y analizadores creados previamente. Para cada objeto de contenido clasificado en categorías con analizadores vinculados, el servicio invoca automáticamente el análisis en el objeto de contenido mediante el analizador correspondiente.

Por ejemplo, puede usar esta vinculación para crear clasificadores que identifiquen y analicen solo las facturas de un PDF que contenga varios tipos de formularios en un documento. Establezca analyzerId en uno de nuestros analizadores preconstruidos o personalizados para dirigir y extraer campos de los documentos o páginas clasificados.

También puede omitir la configuración de cualquier analyzerId para clasificar, pero no realizar ningún análisis de contenido en el archivo o segmento categorizado.

En la capa superior, también puede especificar omitContent como true para asegurarse de que el objeto de contenido original se omite y solo devuelve objetos de contenido de otros análisis realizados en el segmento o los archivos clasificados.

Clasificador jerárquico

La operación del analizador recién diseñada permite la división jerárquica y la clasificación. Por ejemplo, dentro de la operación del analizador base, puede establecer el analyzerID para las categorías de contenido que definió con su analizador personalizado que realiza una clasificación o división adicional, en función de la necesidad. La definición de analizadores jerárquicos permite escenarios como la clasificación de diferentes tipos de documentos, como facturas, contratos y recibos. El analyzerID para cada una de estas categorías puede también referirse a una operación de análisis con una clasificación adicional habilitada para distintos tipos de archivos dentro de las facturas, contratos y recibos.

Las entradas de documento admiten cinco niveles de anidamiento y las entradas de vídeo admiten dos.

Límites del clasificador

Para obtener información sobre los formatos de documento de entrada admitidos y los límites del clasificador, consulte Límites y cuotas de servicio.

procedimientos recomendados

Para mejorar la clasificación y la calidad de división, use un buen nombre de categoría y una descripción para que el modelo pueda comprender las categorías con algún contexto. Para obtener más información sobre los nombres y descripciones de categorías, consulte Procedimientos recomendados.

Ventajas clave

Precisión y confiabilidad: asegúrese de una clasificación precisa de documentos para reducir los errores y aumentar la eficacia.
Escalabilidad: Escale el procesamiento de documentos para satisfacer las demandas empresariales.
Personalizable: adapte el clasificador de documentos para ajustarse a flujos de trabajo específicos.

Idiomas y regiones admitidos

Para obtener una lista de los idiomas y regiones admitidos, consulte Compatibilidad con idiomas y regiones.

Seguridad y privacidad de datos

Los desarrolladores que usan Content Understanding deben revisar las directivas de Microsoft en los datos de los clientes. Para obtener más información, consulte Datos, protección y privacidad.

Pruebe a procesar el contenido del documento en Content Understanding Studio
Obtenga información sobre cómo procesar el contenido del documento mediante plantillas de analizador.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2025-12-19