Wprowadzenie
Przetwarzanie obrazów jest jednym z podstawowych obszarów sztucznej inteligencji (AI) i koncentruje się na tworzeniu rozwiązań, które umożliwiają aplikacjom sztucznej inteligencji przetwarzanie informacji wizualnych.
Rozważ następujące scenariusze:
- Pojazd autonomiczny musi wykrywać i reagować na ruch i pieszych.
- Sklep korzysta z inteligentnych kas z kamerami, aby określić produkty w koszyku klienta.
- Kamera dzwonka do drzwi służy do wykrywania ludzi w drzwiach.
Te przypadki użycia i wiele innych polegają na widzeniu komputerowym.
Oczywiście, komputery nie mają biologicznych oczu, które działają tak, jak nasze, ale są w stanie przetwarzać obrazy, zarówno z transmisji na żywo z kamery, jak i cyfrowych fotografii lub nagrań wideo. Ta możliwość przetwarzania obrazów jest kluczem do tworzenia oprogramowania, które może emulować postrzeganie wizualne przez człowieka. W tym module przeanalizujemy podstawowe elementy, które leżą u podstaw nowoczesnych rozwiązań wizji komputerowej.
Uwaga / Notatka
Zdajemy sobie sprawę, że różni ludzie lubią uczyć się na różne sposoby. Możesz ukończyć ten moduł w formacie wideo lub przeczytać zawartość jako tekst i obrazy. Tekst zawiera więcej szczegółów niż filmy wideo, więc w niektórych przypadkach możesz chcieć odwoływać się do niego jako materiał uzupełniający do prezentacji wideo.