Introdução
A pesquisa visual computacional é uma das principais áreas de IA (inteligência artificial) e se concentra na criação de soluções que permitem que aplicativos de IA processem informações visuais.
Considere estes cenários:
- Um veículo autônomo precisa detectar e responder ao tráfego e aos pedestres.
- Uma loja usa check-outs inteligentes com câmeras para determinar os produtos na cesta de um cliente.
- Uma câmera de campainha é usada para detectar pessoas na porta da frente.
Esses casos de uso, e muitos outros, dependem da visão computacional.
É claro que os computadores não têm olhos biológicos que funcionam como os nossos, mas são capazes de processar imagens; de um feed de câmera ao vivo ou de fotografias digitais ou vídeos. Essa capacidade de processar imagens é a chave para a criação de software que pode emular a percepção visual humana. Neste módulo, examinaremos os blocos de construção que estão por trás de soluções modernas de visão computacional.
Observação
Reconhecemos que pessoas diferentes gostam de aprender de maneiras diferentes. Você pode optar por concluir este módulo em formato baseado em vídeo ou ler o conteúdo como texto e imagens. O texto contém mais detalhes do que os vídeos, portanto, em alguns casos, talvez você queira se referir a ele como material complementar à apresentação de vídeo.