Podsumowanie

1 minuta

Uwaga / Notatka

Aby uzyskać więcej szczegółów, zobacz kartę Tekst i obrazy .

Widzenie komputerowe opiera się na analizie i manipulacji numerycznymi wartościami pikseli w obrazach. Modele uczenia maszynowego są trenowane przy użyciu dużej liczby obrazów, aby umożliwić typowe scenariusze przetwarzania obrazów, takie jak klasyfikacja obrazów, wykrywanie obiektów, segmentacja semantyczna, generowanie podpisów i inne.

Modele używane do wykonywania zadań przetwarzania obrazów ewoluowały od klasyfikatorów obrazów opartych na statystykach poprzez splotowe sieci neuronowe do współczesnych modeli wielomodalnych opartych na przekształcaniu. Najnowocześniejsze modele mogą nie tylko interpretować wejście wizualne, ale także generować wyjście wizualne.

Wskazówka

Aby uzyskać więcej informacji, zobacz Co to jest usługa Azure Vision?.

Sprzężenie zwrotne

Czy ta strona była pomocna?