Visão computacional
Observação
Consulte a guia Texto e imagens para obter mais detalhes!
A visão computacional é a área da inteligência artificial que lida com a análise da entrada visual; como fotografias, vídeos e transmissões de câmaras em direto. A visão computacional é realizada usando um grande número de imagens para treinar um modelo.
Existem vários tipos de modelos de visão computacional.
- A classificação de imagem é uma forma de visão computacional em que um modelo é treinado com imagens que são rotuladas com o assunto principal da imagem (em outras palavras, do que é uma imagem) para que ele possa analisar imagens sem rótulo e prever o rótulo mais apropriado - identificando o assunto da imagem.
- A deteção de objetos é uma forma de visão computacional na qual o modelo é treinado para identificar a localização de objetos específicos em uma imagem.
- A segmentação semântica é uma forma avançada de deteção de objetos onde, em vez de indicar a localização de um objeto desenhando uma caixa à sua volta, o modelo pode identificar os píxeis individuais na imagem que pertencem a um determinado objeto.
- Os modelos multimodais combinam características visuais e descrições textuais associadas, permitindo-lhes gerar descrições abrangentes de imagens.
Cenários de visão computacional
Os usos comuns da visão computacional incluem:
- Agentes de IA que conseguem interpretar inputs visuais.
- Legendagem automática ou geração de etiquetas para fotografias.
- Pesquisa visual.
- Monitoramento dos níveis de estoque ou identificação de itens para checkout em cenários de varejo.
- Monitorização de vídeo de segurança.
- Autenticação através de reconhecimento facial.
- Robótica e veículos autónomos.