Partilhar via


Modelos de processamento de documentos

Este conteúdo aplica-se a:checkmarkmarca de verificaçãoblue-checkmarkv3.1 (GA)blue-checkmarkv3.0 (GA)blue-checkmarkv2.1 (GA)

Este conteúdo aplica-se a:checkmarkmarca de verificaçãov3.1 (GA) | Última versão:purple-checkmark v4.0 (GA)Versões anteriores: Marca de verificação azulv3.0Marca de verificação azulv2.1

Este conteúdo aplica-se a: | marca de verificação roxapurple-checkmark v4.0 (GA) Versão anterior:Marca de verificação azulv2.1

Este conteúdo aplica-se a:checkmarkmarca de verificaçãoblue-checkmarkv4.0 (GA)

O Azure Document Intelligence no Foundry Tools suporta vários modelos que pode usar para adicionar processamento inteligente de documentos às suas aplicações e fluxos. Você pode usar um modelo específico de domínio pré-criado ou treinar um modelo personalizado adaptado às suas necessidades de negócios e casos de uso específicos. Você pode usar o Document Intelligence com a API REST ou bibliotecas de cliente Python, C#, Java e JavaScript.

Nota

Projetos de processamento de documentos que envolvam dados financeiros, dados de saúde protegidos, dados pessoais ou dados altamente sensíveis exigem atenção cuidadosa. Certifique-se de cumprir todos os requisitos nacionais/regionais e específicos do setor.

Descrição geral do modelo

A tabela a seguir mostra os modelos geralmente disponíveis (GA) para cada API estável.

Tipo de modelo Modelo 2024-11-30 (GA) 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Modelos de análise de documentos Ler ✔️ ✔️ ✔️ Não disponível
Modelos de análise de documentos Esquema ✔️ ✔️ ✔️ ✔️
Modelos de análise de documentos Documento geral** Suportado em
Modelo de layout
✔️ ✔️ Não disponível
Modelos pré-criados Cheque bancário ✔️ Não disponível Não disponível Não disponível
Modelos pré-criados Extrato bancário ✔️ Não disponível Não disponível Não disponível
Modelos pré-criados payStub ✔️ Não disponível Não disponível Não disponível
Modelos pré-criados Contrato ✔️ ✔️ Não disponível Não disponível
Modelos pré-criados Cartão de seguro de doença ✔️ ✔️ ✔️ Não disponível
Modelos pré-criados Documento de identificação ✔️ ✔️ ✔️ ✔️
Modelos pré-criados Fatura ✔️ ✔️ ✔️ ✔️
Modelos pré-criados Receção ✔️ ✔️ ✔️ ✔️
Modelos pré-criados Imposto unificado dos EUA* ✔️ Não disponível Não disponível Não disponível
Modelos pré-criados Imposto US 1040* ✔️ ✔️ Não disponível Não disponível
Modelos pré-criados Imposto dos EUA 1095* ✔️ Não disponível Não disponível Não disponível
Modelos pré-criados Imposto dos EUA 1098* ✔️ Não disponível Não disponível Não disponível
Modelos pré-criados Imposto dos EUA 1099* ✔️ Não disponível Não disponível Não disponível
Modelos pré-criados Imposto W2 dos EUA ✔️ ✔️ ✔️ Não disponível
Modelos pré-criados Imposto W4 dos EUA ✔️ Não disponível Não disponível Não disponível
Modelos pré-criados Hipoteca dos EUA 1003 URLA ✔️ Não disponível Não disponível Não disponível
Modelos pré-criados Hipoteca dos EUA 1004 URAR ✔️ Não disponível Não disponível Não disponível
Modelos pré-criados Hipoteca dos EUA 1005 ✔️ Não disponível Não disponível Não disponível
Modelos pré-criados Resumo da hipoteca dos EUA 1008 ✔️ Não disponível Não disponível Não disponível
Modelos pré-criados Divulgação do fechamento de hipotecas nos EUA ✔️ Não disponível Não disponível Não disponível
Modelos pré-criados Certidão de casamento ✔️ Não disponível Não disponível Não disponível
Modelos pré-criados Cartão de crédito ✔️ Não disponível Não disponível Não disponível
Modelos pré-criados Cartão de visita preterido ✔️ ✔️ ✔️
Modelo de classificação personalizado Classificador personalizado ✔️ ✔️ Não disponível Não disponível
Modelo de extração personalizado Neural personalizado ✔️ ✔️ ✔️ Não disponível
Modelo de extração personalizado Modelo personalizado ✔️ ✔️ ✔️ ✔️
Modelo de extração personalizado Composição personalizada ✔️ ✔️ ✔️ ✔️
Todos os modelos Capacidades adicionais ✔️ ✔️ Não disponível Não disponível

* Contém submodelos. Consulte as informações específicas do modelo para variações e subtipos suportados.
** Todos os recursos para o modelo de documento geral estão disponíveis no modelo de layout. O modelo geral não é mais suportado.

Latência

Latência é a quantidade de tempo que um servidor de API leva para lidar e processar uma solicitação de entrada e entregar a resposta de saída para o cliente. O tempo para analisar um documento depende do tamanho (por exemplo, número de páginas) e dos conteúdos associados em cada página. O Document Intelligence é um serviço assíncrono multilocatário onde a latência para documentos semelhantes é comparável, mas nem sempre idêntica. A variabilidade ocasional na latência e no desempenho é inerente a qualquer serviço sem monitoração de estado baseado em microsserviços que processa imagens e documentos grandes em escala. Embora estejamos continuamente ampliando o hardware e a capacidade e os recursos de dimensionamento, você ainda pode ter problemas de latência em tempo de execução.

Capacidade de complemento

Os seguintes recursos complementares estão disponíveis para o Document Intelligence. Para todos os modelos, exceto o modelo de cartão de visita, o Document Intelligence agora suporta recursos adicionais para permitir análises mais sofisticadas. Você pode habilitar e desabilitar esses recursos opcionais dependendo do cenário da extração de documentos. Os seguintes recursos complementares estão disponíveis para a versão 2023-07-31 (GA) e posterior da API:

Capacidade de complemento Add-on/Grátis 30-11-2024 (GA) 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Extração de propriedade de fonte Suplemento ✔️ ✔️ Não disponível Não disponível
Extração de fórmulas Suplemento ✔️ ✔️ Não disponível Não disponível
Extração de alta resolução Suplemento ✔️ ✔️ Não disponível Não disponível
Extração de código de barras Gratuito ✔️ ✔️ Não disponível Não disponível
Deteção de idioma Gratuito ✔️ ✔️ Não disponível Não disponível
Pares chave/valor Gratuito ✔️ Não disponível Não disponível Não disponível
Campos de consulta Complemento* ✔️ Não disponível Não disponível Não disponível
PDF pesquisável Complemento* ✔️ Não disponível Não disponível Não disponível

Recursos de análise de modelo

ID do modelo Extração de conteúdo Campos de consulta Parágrafos Funções de parágrafo Marcas de seleção Tabelas Pares chave/valor Idiomas Códigos de barras Análise documental Fórmulas* Fonte de estilo* Alta resolução* PDF pesquisável
prebuilt-read O O O O O O
prebuilt-layout O O O O O O
prebuilt-contract O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-check.us O O O O O
prebuilt-payStub.us O O O O O
prebuilt-bankStatement O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1004 O O O O O
prebuilt-mortgage.us.1005 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.w4 O O O O O
prebuilt-tax.us.1040 (vários) O O O O O
prebuilt-tax.us.1095A O O O O O
prebuilt-tax.us.1095C O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099 (vários) O O O O O
prebuilt-tax.us.1099SSA O O O O O
{ customModelName } O O O O O

✓ - Ativado
O - Opcional
* - Os recursos Premium incorrem em custos extras

Os campos de consulta têm um preço diferente dos outros recursos do complemento. Para obter mais informações, consulte Preços.

Caixa delimitadora e coordenadas de polígono

Uma caixa delimitadora (polygon na v3.0 e versões posteriores) é um retângulo abstrato que envolve elementos de texto em um documento. Uma caixa delimitadora é usada como ponto de referência para deteção de objetos:

  • A caixa delimitadora especifica a posição usando um plano de coordenadas x e y apresentado em uma matriz de quatro pares numéricos. Cada par representa um canto da caixa na seguinte ordem: superior esquerdo, superior direito, inferior direito, inferior direito, inferior esquerdo.
  • As coordenadas da imagem são apresentadas em pixels. Para um PDF, as coordenadas são apresentadas em polegadas.

Suporte de idiomas

Os modelos universais em Document Intelligence que se baseiam na aprendizagem profunda suportam muitas línguas. Os modelos podem extrair texto multilingue das suas imagens e documentos, incluindo linhas de texto com idiomas mistos. O suporte a idiomas varia de acordo com a funcionalidade do serviço Document Intelligence. Para obter uma lista completa, consulte os seguintes artigos:

Disponibilidade regional

O Document Intelligence está geralmente disponível em muitas das 60+ regiões de infraestrutura global do Azure.

Para ajudar a escolher a região mais adequada para si e para os seus clientes, consulte Geografias do Azure.

Detalhes do modelo

Esta seção descreve a saída que você pode esperar de cada modelo. Você pode estender a saída da maioria dos modelos com recursos adicionais.

Ler OCR

A API de leitura usa reconhecimento ótico de caracteres (OCR) para analisar e extrair linhas e palavras, seus locais, idiomas detetados e estilo de manuscrito, se detetado.

Este documento de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra um documento de exemplo processado usando o Document Intelligence Studio Read.

Análise de layout

O modelo de análise de layout analisa e extrai texto, tabelas, marcas de seleção e outros elementos de estrutura, como títulos, cabeçalhos de seção, cabeçalhos de página e rodapés de página.

Este documento de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra uma página de jornal de exemplo processada usando o Document Intelligence Studio.

Cartão de seguro de doença

O modelo de cartão de seguro de saúde combina recursos poderosos de OCR com modelos de aprendizagem profunda para analisar e extrair informações importantes de cartões de seguro de saúde dos EUA.

Esta amostra de cartão de seguro de saúde dos EUA foi processada usando o Document Intelligence Studio.

Captura de tela que mostra um exemplo de análise de cartão de seguro de saúde dos EUA no Document Intelligence Studio.

Documentos fiscais dos EUA

Os modelos de documentos fiscais dos EUA analisam e extraem campos-chave e itens de linha de um grupo selecionado de documentos fiscais. A API suporta a análise de documentos fiscais dos EUA em inglês de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos digitalizados e PDFs digitais. Os seguintes modelos são atualmente suportados:

Modelo Description ID do modelo
Imposto dos EUA W-2 Extraia detalhes da compensação tributável. prebuilt-tax.us.w2
Imposto dos EUA W-4 Extraia detalhes da compensação tributável. prebuilt-tax.us.w4
Imposto dos EUA 1040 Extraia detalhes de juros de hipoteca. prebuilt-tax.us.1040 (variações)
Imposto dos EUA 1095 Extraia detalhes do seguro de saúde. prebuilt-tax.us.1095 (variações)
Imposto dos EUA 1098 Extraia detalhes de juros de hipoteca. prebuilt-tax.us.1098 (variações)
Imposto dos EUA 1099 Extrair rendimentos recebidos de outras fontes que não o empregador. prebuilt-tax.us.1099 (variações)

Este exemplo de documento W-2 foi processado usando o Document Intelligence Studio.

Captura de tela que mostra um exemplo de documento W-2.

Documentos de hipoteca dos EUA

Os modelos de documentos hipotecários dos EUA analisam e extraem campos-chave que incluem informações sobre mutuários, empréstimos e propriedades de um grupo selecionado de documentos hipotecários. A API suporta a análise de documentos hipotecários americanos em inglês de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos digitalizados e PDFs digitais. Os seguintes modelos são atualmente suportados.

Modelo Description ID do modelo
1003 End-User Contrato de Licença Extrato de empréstimo, mutuário, detalhes do imóvel. prebuilt-mortgage.us.1003
1004 Relatório de Avaliação Residencial Uniforme (URAR) Extrato de empréstimo, mutuário, detalhes do imóvel. prebuilt-mortgage.us.1004
1005 Verificação do emprego Extrato de empréstimo, mutuário, detalhes do imóvel. prebuilt-mortgage.us.1005
1008 Documento de síntese Extraia detalhes do mutuário, vendedor, propriedade, hipoteca e subscrição. prebuilt-mortgage.us.1008
Divulgação de Encerramento Extraia fechamento, custos de transação e detalhes do empréstimo. prebuilt-mortgage.us.closingDisclosure

Este exemplo de documento de Divulgação de Encerramento foi processado usando o Document Intelligence Studio.

Captura de tela que mostra uma amostra de divulgação de fechamento.

Contract

O modelo de contrato analisa e extrai campos-chave e itens de linha de acordos contratuais, incluindo partes, jurisdições, ID do contrato e título. O modelo suporta atualmente os cadernos de encargos em língua inglesa.

Este contrato de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra a extração do modelo de contrato usando o Document Intelligence Studio.

Cheque bancário dos EUA

O modelo de contrato analisa e extrai campos-chave de cheques bancários dos EUA, incluindo detalhes do cheque, detalhes da conta, valor e memorando.

Esta amostra de cheque bancário foi processada usando o Document Intelligence Studio.

Captura de tela que mostra a extração do modelo de cheque bancário usando o Document Intelligence Studio.

Extrato bancário dos EUA

O modelo de extrato bancário analisa e extrai campos-chave e itens de linha de extratos bancários dos EUA: número da conta, detalhes bancários, detalhes do extrato e detalhes da transação.

Este extrato bancário de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra a extração do modelo de extrato bancário usando o Document Intelligence Studio.

payStub

O modelo payStub analisa e extrai campos-chave e itens de linha de documentos e arquivos com informações relacionadas à folha de pagamento.

Este exemplo de stub de pagamento foi processado usando o Document Intelligence Studio.

Captura de tela que mostra a extração do modelo payStub usando o Document Intelligence Studio.

Invoice

O modelo de fatura automatiza o processamento de faturas para extrair o nome do cliente, endereço de cobrança, data de vencimento, valor devido, itens de linha e outros dados importantes.

Esta fatura de exemplo foi processada usando o Document Intelligence Studio.

Captura de ecrã que mostra uma fatura de exemplo.

Recibo

Use o modelo de recibo para verificar os recibos de venda para o nome do comerciante, datas, itens de linha, quantidades e totais de recibos impressos e manuscritos. A versão v3.0 também suporta processamento de recibos de hotel de página única.

Este recibo de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra um recibo de amostra.

Documento de identidade

Use o modelo de documento de identidade (ID) para processar carteiras de motorista dos EUA (todos os 50 estados e Distrito de Colúmbia) e páginas biográficas de passaportes internacionais (excluindo vistos e outros documentos de viagem) para extrair campos-chave.

Este exemplo de carteira de motorista dos EUA foi processado usando o Document Intelligence Studio.

Captura de ecrã que mostra um exemplo de cartão de identificação.

Certidão de casamento

Use o modelo de certidão de casamento para processar certidões de casamento dos EUA para extrair campos-chave, incluindo indivíduos, data e local.

Este exemplo de certidão de casamento dos EUA foi processado usando o Document Intelligence Studio.

Captura de tela que mostra uma certidão de casamento de exemplo.

Cartão de crédito

Use o modelo de cartão de crédito para processar cartões de crédito e débito para extrair campos-chave.

Este cartão de crédito de exemplo foi processado usando o Document Intelligence Studio.

Captura de ecrã que mostra um exemplo de cartão de crédito.

Modelos personalizados

Os modelos personalizados são amplamente classificados em dois tipos. Modelos de classificação personalizados que suportam a classificação de um "tipo de documento" e modelos de extração personalizados que podem extrair um esquema definido de um tipo de documento específico.

Diagrama que mostra tipos de modelos personalizados e modos de construção de modelo associados.

Modelos de documentos personalizados analisam e extraem dados de formulários e documentos específicos para o seu negócio. Eles reconhecem campos de formulário dentro de seu conteúdo distinto e extraem pares de chave/valor e dados de tabela. Você precisa apenas de um exemplo do tipo de formulário para começar.

Os modelos personalizados da versão v3.0 e posteriores oferecem suporte à deteção de assinatura em modelos personalizados (formulário) e páginas cruzadas em modelos neurais e de modelo. A deteção de assinatura procura a presença de uma assinatura, não a identidade da pessoa que assina o documento. Se o modelo retornar não assinado para deteção de assinatura, o modelo não encontrou uma assinatura no campo definido.

Este modelo personalizado de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra o Document Intelligence analisando um formulário personalizado.

Extração personalizada

O modelo de extração personalizado vem em dois tipos: modelo personalizado e neural personalizado. Para criar um modelo de extração personalizado, rotule um conjunto de dados de documentos com os valores que você deseja extrair e treine o modelo no conjunto de dados rotulado. Você precisa de apenas cinco exemplos do mesmo formulário ou tipo de documento para começar.

Esta extração personalizada de exemplo foi processada usando o Document Intelligence Studio.

Captura de tela que mostra a análise do modelo de extração personalizado no Document Intelligence Studio.

Classificador personalizado

Com o modelo de classificação personalizado, você pode identificar o tipo de documento antes de invocar o modelo de extração. O modelo de classificação está disponível a partir da API 2023-07-31 (GA). O treinamento de um modelo de classificação personalizado requer pelo menos duas classes distintas e um mínimo de cinco amostras por classe.

Modelos compostos

Um modelo composto é criado pegando uma coleção de modelos personalizados e atribuindo-os a um único modelo criado a partir de seus tipos de formulário. Você pode atribuir vários modelos personalizados a um modelo composto que são chamados com uma única ID de modelo. Você pode atribuir até 200 modelos personalizados treinados a um único modelo composto.

Este modelo composto de exemplo está no Document Intelligence Studio.

Captura de tela que mostra o painel de modelo personalizado Document Intelligence Studio Compose.

Requisitos de entrada

Os seguintes formatos de ficheiro são suportados.

Modelo PDF Imagem:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Escritório:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lida
Esquema
Documento geral
Pré-criado
Extração personalizada
Classificação personalizada
  • Fotos e digitalizações: para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.
  • PDFs e TIFFs: Para PDFs e TIFFs, até 2.000 páginas podem ser processadas. (Com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas.)
  • Tamanho do arquivo: O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
  • Dimensões da imagem: As dimensões devem estar entre 50 pixels x 50 pixels e 10.000 pixels x 10.000 pixels.
  • Bloqueios de senha: se seus PDFs estiverem bloqueados por senha, você deverá remover o bloqueio antes do envio.
  • Altura do texto: a altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a um texto de cerca de 8 pontos a 150 pontos por polegada.
  • Treinamento de modelo personalizado: o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
  • Treinamento de modelo de extração personalizado: O tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.
  • Treinamento de modelo de classificação personalizado: o tamanho total dos dados de treinamento é de 1 GB com um máximo de 10.000 páginas. Para 2024-11-30 (GA), o tamanho total dos dados de treinamento é de 2 GB com um máximo de 10.000 páginas.
  • Tipos de ficheiro do Office (DOCX, XLSX, PPTX): O limite máximo de comprimento de cadeia de caracteres é de 8 milhões de caracteres.

Nota

A ferramenta Etiquetagem de Exemplo não suporta o formato de ficheiro BMP. A limitação deriva da ferramenta e não do Serviço de Informações Documentais.

Migração de versão

Saiba como usar o Document Intelligence v3.0 em seus aplicativos seguindo as etapas no guia de migração do Document Intelligence v3.1.

Modelo Description
Análise documental
Esquema Extraia texto e informações de layout de documentos.
Pré-criado
Fatura Extraia informações importantes de faturas em inglês e espanhol.
Receção Extraia informações importantes de recibos em inglês.
Documento de identificação Extraia informações importantes de carteiras de motorista dos EUA e passaportes internacionais.
Cartão de visita Extraia informações importantes de cartões de visita em inglês.
Personalizado
Personalizadas Extraia dados de formulários e documentos específicos para o seu negócio. Os modelos personalizados são treinados para seus dados e casos de uso distintos.
Composto Componha uma coleção de modelos personalizados e atribua-os a um único modelo criado a partir de seus tipos de formulário.

Esquema

A API de layout analisa e extrai texto, tabelas e cabeçalhos, marcas de seleção e informações de estrutura de documentos.

Este documento de exemplo foi processado usando a ferramenta Rótulo de amostra.

Captura de tela que mostra a análise de layout usando a ferramenta Rótulo de exemplo.

Invoice

O modelo de fatura analisa e extrai informações importantes das faturas de vendas. A API analisa faturas em vários formatos e extrai informações importantes, como nome do cliente, endereço de cobrança, data de vencimento e valor devido.

Esta fatura de exemplo foi processada usando a ferramenta Etiquetagem de amostra.

Captura de tela que mostra uma análise de fatura de exemplo usando a ferramenta Etiquetagem de amostra.

Recibo

O modelo de recibo analisa e extrai informações importantes de recibos de venda impressos e manuscritos.

Este recibo de amostra foi processado usando a ferramenta Etiquetagem de amostra.

Captura de tela que mostra um recibo de amostra.

Documento de identificação

O modelo de documento ID analisa e extrai informações importantes dos seguintes documentos:

  • Carteiras de motorista dos EUA (todos os 50 estados e Distrito de Colúmbia)
  • Páginas biográficas de passaportes internacionais (excluindo vistos e outros documentos de viagem). A API analisa e extrai documentos de identidade.

Este exemplo de carteira de motorista dos EUA foi processado usando a ferramenta Sample Labeling.

Captura de ecrã que mostra um exemplo de cartão de identificação.

Cartão de visita

O modelo de cartão de visita analisa e extrai informações importantes de imagens de cartão de visita.

Este cartão de visita de exemplo foi processado usando a ferramenta Etiquetagem de amostra.

Captura de tela que mostra um cartão de visita de exemplo.

Personalizado

Modelos personalizados analisam e extraem dados de formulários e documentos específicos para o seu negócio. A API é um programa de aprendizado de máquina treinado para reconhecer campos de formulário dentro de seu conteúdo distinto e extrair pares chave/valor e dados de tabela. Você precisa de apenas cinco exemplos do mesmo tipo de formulário para começar. Você pode treinar seu modelo personalizado com ou sem conjuntos de dados rotulados.

Este modelo personalizado de exemplo foi processado usando a ferramenta Etiquetagem de amostra.

Captura de tela que mostra a ferramenta Document Intelligence analisando um painel de formulário personalizado.

Modelo personalizado composto

Um modelo composto é criado pegando uma coleção de modelos personalizados e atribuindo-os a um único modelo criado a partir de seus tipos de formulário. Você pode atribuir vários modelos personalizados a um modelo composto que são chamados com uma única ID de modelo. Pode atribuir até 100 modelos personalizados preparados a um único modelo composto.

Este painel de modelo composto foi processado usando a ferramenta Etiquetagem de amostra.

Captura de tela que mostra o painel de modelo personalizado Document Intelligence Studio Compose.

Extração de dados do modelo

Modelo Extração de texto Deteção de idioma Marcas de seleção Tabelas Parágrafos Funções de parágrafo Pares chave/valor Fields
Esquema
Fatura
Receção
Documento de identificação
Cartão de visita
Formulário personalizado

Requisitos de entrada

Os seguintes formatos de ficheiro são suportados.

Modelo PDF Imagem:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Escritório:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lida
Esquema
Documento geral
Pré-criado
Extração personalizada
Classificação personalizada
  • Fotos e digitalizações: para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.
  • PDFs e TIFFs: Para PDFs e TIFFs, até 2.000 páginas podem ser processadas. (Com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas.)
  • Tamanho do arquivo: O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
  • Dimensões da imagem: As dimensões devem estar entre 50 pixels x 50 pixels e 10.000 pixels x 10.000 pixels.
  • Bloqueios de senha: se seus PDFs estiverem bloqueados por senha, você deverá remover o bloqueio antes do envio.
  • Altura do texto: a altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a um texto de cerca de 8 pontos a 150 pontos por polegada.
  • Treinamento de modelo personalizado: o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
  • Treinamento de modelo de extração personalizado: O tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.
  • Treinamento de modelo de classificação personalizado: o tamanho total dos dados de treinamento é de 1 GB com um máximo de 10.000 páginas. Para 2024-11-30 (GA), o tamanho total dos dados de treinamento é de 2 GB com um máximo de 10.000 páginas.
  • Tipos de ficheiro do Office (DOCX, XLSX, PPTX): O limite máximo de comprimento de cadeia de caracteres é de 8 milhões de caracteres.

Nota

A ferramenta Etiquetagem de Exemplo não suporta o formato de ficheiro BMP. A limitação deriva da ferramenta e não da Document Intelligence.

Migração de versão

Você pode aprender a usar o Document Intelligence v3.0 em seus aplicativos seguindo as etapas no guia de migração do Document Intelligence v3.1