Compartilhar via


OCR - reconhecimento óptico de caracteres

Aviso

Não recomendamos usar esse serviço, incluindo a Visão do Azure no Foundry Tools API OCR herdado v3.2 e API RecognizeText v2.1.

Edições de OCR (leitura)

Importante

Selecione a edição de Leitura que melhor atenda aos seus requisitos.

Entrada Exemplos Edição de Leitura Benefício
Imagens: gerais, na natureza rótulos, placas de rua e cartazes OCR para imagens (versão 4.0) Otimizado para imagens gerais, não documentais, com uma API síncrona com desempenho aprimorado que facilita a incorporação de OCR nos cenários de experiência do usuário.
Documentos: digitais e digitalizados, incluindo imagens livros, artigos e relatórios Modelo de leitura da Informação de Documentos Otimizado para documentos digitais e digitalizados contendo texto intenso com uma API assíncrona para ajudar a automatizar o processamento inteligente de documentos em escala.

Sobre a API de Leitura da versão 3.2 do Azure Vision

Procurando a API de Leitura mais recente da versão 3.2 do Azure Vision? Todos os aprimoramentos futuros do OCR de Leitura fazem parte dos dois serviços listados anteriormente. Não há mais atualizações para o Azure Vision v3.2. Para obter mais informações, consulte API de Leitura GA do Azure Vision 3.2 e Início Rápido: Leitura GA do Azure Vision v3.2.

OCR ou Reconhecimento Óptico de Caracteres também é conhecido como reconhecimento de texto ou extração de texto. As técnicas de OCR baseadas em aprendizado de máquina permitem extrair texto impresso ou manuscrito de imagens como cartazes, placas de rua e rótulos de produtos, bem como de documentos como artigos, relatórios, formulários e faturas. Normalmente, o texto é extraído como palavras, linhas de texto e parágrafos ou blocos de texto, permitindo o acesso à versão digital do texto digitalizado. Essa funcionalidade elimina ou reduz significativamente a necessidade de entrada manual de dados.

Mecanismo OCR

O mecanismo OCR de Leitura da Microsoft usa vários modelos avançados de machine learning que dão suporte a idiomas globais. Ele extrai texto impresso e manuscrito, incluindo idiomas mistos e estilos de escrita. Você pode usar Read como um serviço de nuvem ou como um contêiner local para uma implantação flexível. Ele também está disponível como uma API síncrona para cenários únicos, não documentais, somente imagem, com aprimoramentos de desempenho que simplificam a implementação de experiências de usuário assistidas por OCR.

O IDP (Processamento Inteligente de Documentos) usa o OCR como sua tecnologia fundamental para extrair estrutura, relações, valores-chave, entidades e outros insights centrados em documentos com um serviço avançado de IA baseado em machine learning, como o Document Intelligence. Informação de Documentos incluem uma versão otimizada para documentos do Read como seu mecanismo OCR, enquanto delega a outros modelos para insights mais avançados. Se você estiver extraindo texto de documentos digitalizados e digitais, use Document Intelligence Read OCR.

Como usar OCR

Experimente o OCR usando o Vision Studio. Em seguida, siga um dos links para a edição Read que seja adequada para você.

Captura de tela: demonstração do Read OCR no Vision Studio.

Idiomas compatíveis para OCR

Ambas as versões de leitura disponíveis hoje no Azure Vision dão suporte a vários idiomas para texto impresso e manuscrito. O OCR para texto impresso é compatível com inglês, francês, alemão, italiano, português, espanhol, chinês, japonês, coreano, russo, árabe, hindi e outros idiomas internacionais que usam scripts latinos, cirílicos, árabes e devanágaros. O OCR para texto manuscrito dá suporte aos idiomas inglês, chinês simplificado, francês, alemão, italiano, japonês, coreano, português e espanhol.

Veja a lista completa de idiomas compatíveis com o OCR.

Recursos comuns do OCR

O Ler o modelo OCR está disponível na Visão do Azure e na Informação de Documentos com os recursos comuns da linha de base, otimizando para os respectivos cenários. A lista a seguir resume os recursos comuns:

  • Extração de texto impresso e manuscrito nos idiomas com suporte
  • Páginas, linhas de texto e palavras com pontuações de localização e confiança
  • Suporte para idiomas mistos, modo misto (impressão e manuscrito)
  • Disponível como um contêiner do Docker sem distro para implantação local

Use a APIs do OCR de nuvem ou a implantação local

A maioria dos clientes prefere as APIs de nuvem porque elas são fáceis de integrar e oferecem produtividade rápida. O Azure e o serviço do Azure Vision lidam com as necessidades de escala, desempenho, segurança de dados e conformidade enquanto você se concentra em atender às necessidades de seus clientes.

Quanto à implantação local, o contêiner do Docker de Leitura permite que você implante as funcionalidades do OCR em disponibilidade geral da Visão do Azure v3.2 no seu ambiente local. Contêineres são excelentes para especificar requisitos de segurança e governança de dados.

Requisitos de entrada

A API de Leitura usa imagens e documentos como entrada. As imagens e os documentos devem atender aos seguintes requisitos:

  • Os formatos de arquivo com suporte são JPEG, PNG, BMP, PDF e TIFF.
  • Para arquivos PDF e TIFF, até 2.000 páginas são processadas (apenas as duas primeiras páginas da camada gratuita).
  • O tamanho do arquivo de imagens deve ter menos de 500 MB (4 MB para a camada gratuita) com dimensões de pelo menos 50 x 50 pixels e no máximo 10.000 x 10.000 pixels. Os arquivos PDF não têm um limite de tamanho.
  • A altura mínima do texto a ser extraído é de 12 pixels para uma imagem 1024 x 768, que corresponde a cerca de 8 pontos de texto de fonte a 150 DPI.

Observação

Não é necessário cortar uma imagem para linhas de texto. Envie a imagem inteira para a API de Leitura e ela reconhece todos os textos.

Dados de privacidade e segurança do OCR

Assim como acontece com todas as Ferramentas de Fundação, os desenvolvedores que usam o serviço Azure Vision devem estar cientes das políticas da Microsoft sobre os dados do cliente. Consulte a página Foundry Tools na Central de Confiabilidade da Microsoft para saber mais.

Próximas etapas