Wprowadzenie

Ukończone

Przetwarzanie obrazów jest jednym z podstawowych obszarów sztucznej inteligencji (AI) i koncentruje się na tworzeniu rozwiązań, które umożliwiają aplikacjom sztucznej inteligencji przetwarzanie informacji wizualnych.

Rozważ następujące scenariusze:

  • Pojazd autonomiczny musi wykrywać i reagować na ruch i pieszych.
  • Sklep korzysta z inteligentnych kas z kamerami, aby określić produkty w koszyku klienta.
  • Kamera dzwonka do drzwi służy do wykrywania ludzi w drzwiach.

Te przypadki użycia i wiele innych polegają na widzeniu komputerowym.

Oczywiście, komputery nie mają biologicznych oczu, które działają tak, jak nasze, ale są w stanie przetwarzać obrazy, zarówno z transmisji na żywo z kamery, jak i cyfrowych fotografii lub nagrań wideo. Ta możliwość przetwarzania obrazów jest kluczem do tworzenia oprogramowania, które może emulować postrzeganie wizualne przez człowieka. W tym module przeanalizujemy podstawowe elementy, które leżą u podstaw nowoczesnych rozwiązań wizji komputerowej.

Uwaga / Notatka

Zdajemy sobie sprawę, że różni ludzie lubią uczyć się na różne sposoby. Możesz ukończyć ten moduł w formacie wideo lub przeczytać zawartość jako tekst i obrazy. Tekst zawiera więcej szczegółów niż filmy wideo, więc w niektórych przypadkach możesz chcieć odwoływać się do niego jako materiał uzupełniający do prezentacji wideo.