Visão computacional

Concluído

Observação

Consulte a guia Texto e imagens para obter mais detalhes!

A visão computacional é a área da inteligência artificial que lida com a análise da entrada visual; como fotografias, vídeos e transmissões de câmaras em direto. A visão computacional é realizada usando um grande número de imagens para treinar um modelo.

Diagrama de um modelo de visão computacional a ser treinado com um grande volume de imagens.

Existem vários tipos de modelos de visão computacional.

  • A classificação de imagem é uma forma de visão computacional em que um modelo é treinado com imagens que são rotuladas com o assunto principal da imagem (em outras palavras, do que é uma imagem) para que ele possa analisar imagens sem rótulo e prever o rótulo mais apropriado - identificando o assunto da imagem.
  • A deteção de objetos é uma forma de visão computacional na qual o modelo é treinado para identificar a localização de objetos específicos em uma imagem.
  • A segmentação semântica é uma forma avançada de deteção de objetos onde, em vez de indicar a localização de um objeto desenhando uma caixa à sua volta, o modelo pode identificar os píxeis individuais na imagem que pertencem a um determinado objeto.
  • Os modelos multimodais combinam características visuais e descrições textuais associadas, permitindo-lhes gerar descrições abrangentes de imagens.

Cenários de visão computacional

Os usos comuns da visão computacional incluem:

  • Agentes de IA que conseguem interpretar inputs visuais.
  • Legendagem automática ou geração de etiquetas para fotografias.
  • Pesquisa visual.
  • Monitoramento dos níveis de estoque ou identificação de itens para checkout em cenários de varejo.
  • Monitorização de vídeo de segurança.
  • Autenticação através de reconhecimento facial.
  • Robótica e veículos autónomos.