Partilhar via


Document Intelligence Modelos de documentos fiscais dos EUA

Este conteúdo aplica-se a:checkmarkmarca de verificaçãov4.0 (GA) | Versões anteriores:blue-checkmarkv3.1 (GA) :::moniker-end

Este conteúdo aplica-se a:checkmarkmarca de verificaçãopurple-checkmarkv4.0 (GA)

O modelo fiscal de Inteligência Documental usa poderosos recursos de Reconhecimento Ótico de Caracteres (OCR) para analisar e extrair campos-chave e itens de linha de um grupo selecionado de documentos fiscais. Os documentos fiscais podem ser de vários formatos como 1099, 1098, W2, 1040, 1095A, 1095C, W-4, 1099-SSA. O formato de entrada pode incluir imagens capturadas por telefone, documentos digitalizados e PDFs digitais. A API analisa o texto do documento; extrai informações importantes e retorna uma representação de dados JSON estruturada. Atualmente, o modelo suporta determinados formatos de documentos fiscais em inglês.

Tipos de formulário de imposto suportados:

  • Imposto unificado dos EUA
  • W-2
  • 1098
  • Artigo 1098-E
  • 1098-T
  • 1099 e variações (acrescentado 1099-SSA)
  • 1040 e variações
  • 1095A, 1095C
  • W-4º

Processamento automatizado de documentos fiscais

O processamento automatizado de documentos fiscais é o processo de extração de campos-chave de documentos fiscais. Historicamente, os documentos fiscais eram processados manualmente. Este modelo permite a fácil automatização de cenários fiscais.

Imposto Unificado dos EUA

O Unified US Tax modelo pré-construído deteta e extrai automaticamente dados de W2, 1098, 1040e 1099 formulários fiscais em documentos enviados. Estes documentos podem ser compostos por muitos documentos fiscais ou não relacionados com impostos. O modelo processa apenas as formas que suporta.

Captura de ecrã de um diagrama de processamento de Imposto Unificado.

Opções de desenvolvimento

O Document Intelligence v4.0: 2024-11-30 (GA) suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística Recursos ID do modelo
Modelos de formulário de imposto dos EUA • Document Intelligence Studio • prebuilt-tax.us• prebuilt-tax.us.w2
• prebuilt-tax.us.W-4
• prebuilt-tax.us.1095A
• prebuilt-tax.us.1095C
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T
• prebuilt-tax.us.1099A
• prebuilt-tax.us.1099B
• prebuilt-tax.us.1099C
• prebuilt-tax.us.1099CAP
• prebuilt-tax.us.1099Combo
• prebuilt-tax.us.1099DIV
• prebuilt-tax.us.1099G
• prebuilt-tax.us.1099H

imposto pré-construído.us.1099INT
• prebuilt-tax.us.1099K
• prebuilt-tax.us.1099LS
• prebuilt-tax.us.1099LTC
• prebuilt-tax.us.1099MISC
• prebuilt-tax.us.1099NEC
• prebuilt-tax.us.1099OID
• prebuilt-tax.us.1099PATR
• prebuilt-tax.us.1099Q
• prebuilt-tax.us.1099QA
• prebuilt-tax.us.1099R
• prebuilt-tax.us.1099S
• prebuilt-tax.us.1099SA
• prebuilt-tax.us.1099SB
• prebuilt-tax.us.1099SSA
• prebuilt-tax.us.1040
• prebuilt-tax.us.1040Schedule1
• prebuilt-tax.us.1040Schedule2
• prebuilt-tax.us.1040Schedule3
• prebuilt-tax.us.1040Schedule8812
• prebuilt-tax.us.1040ScheduleA
• prebuilt-tax.us.1040ScheduleB
• prebuilt-tax.us.1040ScheduleC
• prebuilt-tax.us.1040ScheduleD
• prebuilt-tax.us.1040ScheduleE
• prebuilt-tax.us.1040ScheduleEIC
• prebuilt-tax.us.1040ScheduleF
• prebuilt-tax.us.1040ScheduleH
• prebuilt-tax.us.1040ScheduleJ
• prebuilt-tax.us.1040ScheduleR
• prebuilt-tax.us.1040ScheduleSE
• prebuilt-tax.us.1040Senior

O Document Intelligence v3.1 suporta as seguintes ferramentas, aplicativos e bibliotecas:

Caraterística Recursos ID do modelo
Modelos de formulário de imposto dos EUA • Document Intelligence Studio • prebuilt-tax.us.w2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

O Document Intelligence v3.0 suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística Recursos ID do modelo
Modelos de formulário de imposto dos EUA • Document Intelligence Studio • prebuilt-tax.us.w2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

Requisitos de entrada

Os seguintes formatos de ficheiro são suportados.

Modelo PDF Imagem:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Escritório:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lida
Esquema
Documento geral
Pré-criado
Extração personalizada
Classificação personalizada
  • Fotos e digitalizações: para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.
  • PDFs e TIFFs: Para PDFs e TIFFs, até 2.000 páginas podem ser processadas. (Com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas.)
  • Tamanho do arquivo: O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
  • Dimensões da imagem: As dimensões devem estar entre 50 pixels x 50 pixels e 10.000 pixels x 10.000 pixels.
  • Bloqueios de senha: se seus PDFs estiverem bloqueados por senha, você deverá remover o bloqueio antes do envio.
  • Altura do texto: a altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a um texto de cerca de 8 pontos a 150 pontos por polegada.
  • Treinamento de modelo personalizado: o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
  • Treinamento de modelo de extração personalizado: O tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.
  • Treinamento de modelo de classificação personalizado: o tamanho total dos dados de treinamento é de 1 GB com um máximo de 10.000 páginas. Para 2024-11-30 (GA), o tamanho total dos dados de treinamento é de 2 GB com um máximo de 10.000 páginas.
  • Tipos de ficheiro do Office (DOCX, XLSX, PPTX): O limite máximo de comprimento de cadeia de caracteres é de 8 milhões de caracteres.

Experimente a extração de dados de documentos fiscais

Veja como os dados, incluindo informações do cliente, detalhes do fornecedor e itens de linha, são extraídos das faturas. Você precisa dos seguintes recursos:

  • Uma assinatura do Azure — você pode criar uma gratuitamente.

  • Uma instância de Document Intelligence no portal do Azure. Você pode usar o nível de preço gratuito (F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter sua chave e o ponto de extremidade.

Captura de ecrã das chaves e da localização do ponto de extremidade no portal do Azure.

Estúdio de Inteligência de Documentação

  1. Na página inicial do Document Intelligence Studio, selecione o modelo de documento fiscal suportado.

  2. Pode analisar um exemplo de documento fiscal ou carregar os seus próprios ficheiros.

  3. Selecione o botão Executar análise e, se necessário, configure as opções Analisar :

    Captura de tela dos botões Executar análise e Analisar opções no Document Intelligence Studio.

Idiomas e localidades suportados

Consulte a nossa página Suporte a idiomas — modelos pré-construídos para obter uma lista completa dos idiomas suportados.

Extração de campo

Para campos de extração de documentos suportados, consulte as páginas de esquema de modelo de documento fiscal em nosso repositório de exemplo do GitHub.

As notas fiscais, os pares chave-valor e os itens de linha extraídos estão na documentResults seção da saída JSON.

Próximos passos

Encontre mais exemplos no GitHub.

Encontre mais exemplos no GitHub.