Introdução
A visão computacional é uma das principais áreas da inteligência artificial (IA), e se concentra na criação de soluções que permitem que as aplicações de IA processem informações visuais.
Considere estes cenários:
- Um veículo autónomo precisa de detetar e responder ao tráfego e aos peões.
- Uma loja usa checkouts inteligentes com câmeras para determinar os produtos na cesta de um cliente.
- Uma câmera de campainha é usada para detetar pessoas na sua porta da frente.
Estes casos de uso, e muitos outros, dependem da visão computacional.
É claro que os computadores não têm olhos biológicos que funcionam como os nossos, mas são capazes de processar imagens; seja a partir de um feed de câmera ao vivo ou de fotografias ou vídeos digitais. Esta capacidade de processar imagens é a chave para a criação de software que pode emular a perceção visual humana. Neste módulo, examinaremos os blocos de construção subjacentes às soluções modernas de visão computacional.
Observação
Reconhecemos que pessoas diferentes gostam de aprender de maneiras diferentes. Pode optar por completar este módulo em formato de vídeo ou pode ler o conteúdo como texto e imagens. O texto contém mais detalhes do que os vídeos, portanto, em alguns casos, você pode querer se referir a ele como material complementar à apresentação do vídeo.