Visão computacional

{númeroDeMinutos} minutos

Observação

Consulte a guia Texto e imagens para obter mais detalhes!

A visão computacional é a área da inteligência artificial que lida com a análise da entrada visual; como fotografias, vídeos e transmissões de câmaras em direto. A visão computacional é realizada usando um grande número de imagens para treinar um modelo.

Diagrama de um modelo de visão computacional a ser treinado com um grande volume de imagens.

Existem vários tipos de modelos de visão computacional.

A classificação de imagem é uma forma de visão computacional em que um modelo é treinado com imagens que são rotuladas com o assunto principal da imagem (em outras palavras, do que é uma imagem) para que ele possa analisar imagens sem rótulo e prever o rótulo mais apropriado - identificando o assunto da imagem.
A deteção de objetos é uma forma de visão computacional na qual o modelo é treinado para identificar a localização de objetos específicos em uma imagem.
A segmentação semântica é uma forma avançada de deteção de objetos onde, em vez de indicar a localização de um objeto desenhando uma caixa à sua volta, o modelo pode identificar os píxeis individuais na imagem que pertencem a um determinado objeto.
Os modelos multimodais combinam características visuais e descrições textuais associadas, permitindo-lhes gerar descrições abrangentes de imagens.

Cenários de visão computacional

Os usos comuns da visão computacional incluem:

Agentes de IA que conseguem interpretar inputs visuais.
Legendagem automática ou geração de etiquetas para fotografias.
Pesquisa visual.
Monitoramento dos níveis de estoque ou identificação de itens para checkout em cenários de varejo.
Monitorização de vídeo de segurança.
Autenticação através de reconhecimento facial.
Robótica e veículos autónomos.

Feedback

Esta página foi útil?