Compartilhar via


Classificação/segmentação da Compreensão de conteúdo

O Content Understanding permite que os clientes implementem a classificação e a divisão como parte da solicitação de operação do analisador. Você pode executar a classificação de conteúdo e a extração de conteúdo como parte de uma única chamada à API.

O conceito global de analyzer agora inclui os conceitos de contentCategories e enableSegment para classificar e dividir os dados de entrada que você processa em seu aplicativo. Esse recurso do analisador pode executar a classificação de um arquivo de entrada como um todo. Ele também pode identificar vários documentos ou várias instâncias de um único documento em um arquivo de entrada.

A partir da versão ga, a classificação de documentos e o design de segmentação de vídeo são unificados, permitindo uma abordagem coerente para processar dados de entrada, independentemente de sua modalidade. Na documentação, "Classificação da Compreensão de conteúdo" refere-se às operações de análise necessárias para classificar e dividir dados de entrada (contentCategories e enableSegment).

Casos de uso de negócios

A classificação de Compreensão de Conteúdo permite o processamento de documentos e vídeos complexos em vários formatos e modelos:

  • Faturas: categorize faturas de vários fornecedores para processar cada categoria com um analisador de Compreensão de Conteúdo diferente, se necessário.
  • Documentos fiscais: Categorize vários documentos fiscais em diferentes tipos de formulários fiscais, como 1040 e 1099.
  • Contratos: categorize contratos longos e não estruturados para simplificar as operações para entender diferentes tipos de contratos e suas implicações legais específicas.
  • Vídeo esportivo: Segmente automaticamente as cenas para dividir o vídeo em partes lógicas, como anúncios e o conteúdo esportivo real.

Recursos de classificação/segmentação

O Content Understanding pode analisar documentos únicos ou de vários arquivos para identificar se um arquivo de entrada pode ser classificado em uma categoria conforme definido. Os cenários a seguir têm suporte:

Cenários de documento:

  • Classificar somente: classifica o arquivo de entrada como um todo. Por exemplo, um único arquivo que contém um tipo de documento, como um formulário de solicitação de empréstimo.
  • Classificar e analisar: classifica e analisa o arquivo de entrada roteando a entrada para o analisador de extração desejado.
  • Classificar e segmentar: classifica e segmenta um único arquivo de entrada que pode ter vários tipos ou instâncias de documentos concatenados. Por exemplo, um pacote de pedido de empréstimo que contém um formulário de solicitação de empréstimo, boleto de pagamento e extrato bancário. Outro exemplo é uma coleção de faturas digitalizadas em um único arquivo.
  • Classificar, segmentar e analisar: depois que os segmentos forem classificados, encaminhe cada segmento para o analisador de extração desejado para extração de campo adicional.
  • Classificador hierárquico: uma análise adicional e opcional, que dependa da categoria, também pode funcionar como um analisador de classificador.

Cenários de vídeo:

  • Somente segmento: dividir vídeo em segmentos com base nas características de conteúdo definidas no description campo de contentCategories. Por exemplo, dividir uma transmissão esportiva em segmentos de jogos, comerciais e comentários.
  • Segmentar e analisar: divida o vídeo em segmentos e encaminhe cada segmento para um analisador para extração de campo.

Observação

A unidade mínima para classificação de documentos é uma única página. Não há suporte para a classificação intra-página.

Criar categorias de classificação

A classificação de Reconhecimento de Conteúdo não requer um conjunto de dados de treinamento. Você pode definir até 200 nomes de categoria e descrições dentro da operação de análise. Por padrão, todo o arquivo é tratado como um único objeto de conteúdo, o que significa que o arquivo será associado a uma única categoria.

A partir da versão GA, você precisa incluir a categoria other dentro de contentCategories para garantir que o conteúdo possa permanecer não associado a nenhuma das suas categorias definidas. Se a other categoria não estiver incluída, todos os arquivos serão forçados a serem classificados em uma de suas categorias definidas. Cada um dos nomes de categoria que você define contentCategories também pode incluir um description para fornecer mais informações sobre a categoria que você está definindo.

Divisão de arquivo de entrada

Quando você tem mais de um documento em um arquivo, o classificador pode identificar os diferentes tipos de documento contidos no arquivo de entrada com a capacidade de divisão. A resposta do classificador contém os intervalos de página para cada um dos tipos de documento identificados contidos em um arquivo. Essa resposta pode incluir várias instâncias do mesmo tipo de documento.

Quando você executa a analyze operação, ela agora inclui uma enableSegment propriedade que fornece controle granular sobre o comportamento de divisão. Você também pode especificar os números de página para analisar apenas determinadas páginas do documento de entrada:

  • Para tratar todo o arquivo de entrada como vários documentos combinados para classificação, defina enableSegment como true. Quando você faz isso, o serviço retorna categorias para os segmentos dentro do arquivo de entrada automaticamente.
  • Para tratar todo o arquivo de entrada como um único documento, defina enableSegment como false.

Observação

Para vídeos, há suporte apenas para segmentação. Você deve definir um único contentCategories com enableSegment definido como true. Use o description campo para especificar critérios para dividir o vídeo em segmentos.

Análise opcional

Para um fluxo completo de ponta a ponta, você pode vincular categorias de classificador com analisadores personalizados existentes e analisadores predefinidos. Para cada objeto de conteúdo classificado para categorias com analisadores vinculados, o serviço invoca automaticamente a análise no objeto de conteúdo usando o analisador correspondente.

Por exemplo, você pode usar essa vinculação para criar classificadores que identificam e analisam apenas faturas de um PDF que contém vários tipos de formulários em um documento. Defina analyzerId como um de nossos analisadores predefinidos ou analisadores personalizados para rotear e executar a extração de campos dos documentos ou páginas classificados.

Você também pode omitir a configuração de qualquer analyzerId para categorizar, mas sem executar nenhuma análise de conteúdo no arquivo ou segmento categorizado.

Na camada superior, você também pode especificar omitContent como true para garantir que o objeto de conteúdo original seja omitido e apenas retorne objetos de conteúdo de outra análise executada no segmento ou arquivos classificados.

Classificador hierárquico

A operação do analisador recém-projetada permite a divisão e a classificação hierárquicas. Por exemplo, na operação do analisador de base, você pode definir a analyzerID nas categorias de conteúdo que você definiu com seu analisador personalizado que executa a classificação ou divisão adicionais, dependendo da necessidade. A definição de analisadores hierárquicos permite cenários como a categorização de diferentes tipos de documentos, tais como faturas, contratos e recibos, com o analyzerID para todas essas categorias, podendo também ser uma operação de análise com classificação adicional ativada para diferentes tipos de arquivos nas faturas, contratos e recibos.

As entradas de documento dão suporte a cinco níveis de aninhamento e as entradas de vídeo dão suporte a dois.

Limites do classificador

Para obter informações sobre formatos de documento de entrada com suporte e limites de classificador, consulte cotas e limites de serviço.

Práticas recomendadas

Para melhorar a qualidade de classificação e divisão, use um bom nome de categoria e descrição para que o modelo possa entender as categorias com algum contexto. Para obter mais informações sobre nomes de categoria e descrições, consulte As práticas recomendadas.

Principais benefícios

  • Precisão e confiabilidade: verifique a classificação precisa do documento para reduzir erros e aumentar a eficiência.
  • Escalabilidade: dimensionar o processamento de documentos para atender às demandas comerciais.
  • Personalizável: adapte o classificador de documento para ajustar fluxos de trabalho específicos.

Idiomas e regiões com suporte

Para obter uma lista de idiomas e regiões com suporte, consulte o suporte a idiomas e regiões.

Segurança e privacidade de dados

Os desenvolvedores que usam o Content Understanding devem examinar as políticas da Microsoft sobre os dados do cliente. Para obter mais informações, consulte Dados, proteção e privacidade.