Udostępnij przez


Szybki start: tworzenie modelu klasyfikacji obrazów za pomocą portalu Custom Vision

Ważne

Firma Microsoft ogłasza planowaną emeryturę usługi Azure Custom Vision. Firma Microsoft zapewni pełną pomoc techniczną dla wszystkich istniejących klientów usługi Azure Custom Vision do 25.09.2028 r. W tym oknie pomocy technicznej zachęcamy klientów do rozpoczęcia planowania i przeprowadzania przejścia do alternatywnych rozwiązań. W zależności od przypadku użycia zalecamy następujące ścieżki przejścia:

  • W przypadku tworzenia modeli niestandardowych na potrzeby klasyfikacji obrazów i wykrywania obiektów usługa Azure Machine Learning AutoML oferuje możliwość trenowania obu typów modeli niestandardowych przy użyciu klasycznych technik uczenia maszynowego
  • Dowiedz się więcej o usłudze Azure Machine Learning AutoML i dowiedz się, jak może ona oferować obsługę trenowania modelu niestandardowego.

Firma Microsoft inwestuje również w rozwiązania oparte na sztucznej inteligencji, które zwiększają dokładność w scenariuszach niestandardowych przy użyciu inżynierii monitów i innych technik.

  • Aby użyć modeli generatywnych, możesz użyć jednego z modeli dostępnych w katalogu modeli Foundry i utworzyć własne rozwiązanie dla niestandardowych potrzeb wizualnych.
  • Dla zarządzanego rozwiązania generatywnego do klasyfikacji obrazów, usługa Azure Content Understanding w narzędziach Foundry Tools (obecnie w publicznej wersji zapoznawczej) oferuje możliwość tworzenia niestandardowych przepływów pracy klasyfikacji. Obsługuje również przetwarzanie danych bez struktury dowolnego typu (obraz, dokumenty, dźwięk, wideo) i wyodrębnianie szczegółowych informacji strukturalnych na podstawie wstępnie zdefiniowanych lub zdefiniowanych przez użytkownika formatów.
  • Dowiedz się więcej o modelach microsoft Foundry i usłudze Azure Content Understanding (publiczna wersja zapoznawcza) i dowiedz się, jak mogą one oferować alternatywne ścieżki dla Twoich potrzeb niestandardowych.

Aby uzyskać bardziej szczegółowe wskazówki dotyczące migracji, zobacz Przewodnik po migracji usługi Azure Custom Vision.

W tym przewodniku Szybki start wyjaśniono, jak utworzyć model klasyfikacji obrazów za pomocą portalu internetowego usługi Custom Vision. Po utworzeniu modelu możesz przetestować go przy użyciu nowych obrazów i w końcu zintegrować go z własną aplikacją do rozpoznawania obrazów.

Wymagania wstępne

  • Subskrypcja platformy Azure. Możesz utworzyć bezpłatne konto.
  • Zestaw obrazów do trenowania modelu klasyfikacji. Możesz użyć zestawu przykładowych obrazów w usłudze GitHub. Możesz też wybrać własne obrazy, korzystając z poniższych wskazówek.
  • Obsługiwana przeglądarka internetowa.

Tworzenie zasobów usługi Custom Vision

Aby korzystać z usługi Custom Vision, należy utworzyć zasoby szkoleniowe i przewidywania usługi Custom Vision na platformie Azure. W portalu Azure użyj strony Tworzenie usługi Custom Vision, aby utworzyć zarówno zasób szkoleniowy, jak i zasób prognozowania.

Tworzenie nowego projektu

Przejdź do strony internetowej usługi Custom Vision, a następnie zaloguj się przy użyciu tego samego konta, które zostało użyte do zalogowania się w witrynie Azure Portal.

Zrzut ekranu przedstawiający stronę logowania usługi Custom Vision.

  1. Aby utworzyć pierwszy projekt, wybierz pozycję Nowy projekt. Zostanie wyświetlone okno dialogowe Tworzenie nowego projektu .

    Zrzut ekranu przedstawiający okno dialogowe nowego projektu z polami nazwy, opisu i domen.

  2. Wprowadź nazwę i opis projektu. Następnie wybierz zasób szkoleniowy Custom Vision. Jeśli zalogowane konto jest skojarzone z kontem platformy Azure, na liście rozwijanej Zasób zostaną wyświetlone wszystkie zgodne zasoby platformy Azure.

    Uwaga

    Jeśli żaden zasób nie jest dostępny, upewnij się, że zalogowałeś się do customvision.ai przy użyciu tego samego konta, które zostało użyte do zalogowania się w witrynie Azure Portal. Upewnij się również, że wybrano ten sam katalog w witrynie internetowej usługi Custom Vision co katalog w witrynie Azure Portal, w której znajdują się zasoby usługi Custom Vision. W obu witrynach możesz wybrać swój katalog z menu rozwijanego konta w prawym górnym rogu ekranu.

  3. Wybierz pozycję Klasyfikacja w obszarze Typy projektów. Następnie w obszarze Typy klasyfikacji wybierz pozycję Multilabel lub Multiclass w zależności od przypadku użycia. Klasyfikacja wieloetykietowa stosuje dowolną liczbę etykiet do obrazu (zero lub więcej), podczas gdy klasyfikacja wieloklasowa sortuje obrazy do pojedynczych kategorii (każdy przesłany obraz jest przyporządkowany do najbardziej prawdopodobnej etykiety). Jeśli chcesz, możesz później zmienić typ klasyfikacji.

  4. Następnie wybierz jedną z dostępnych domen. Każda domena optymalizuje model pod kątem określonych typów obrazów, zgodnie z opisem w poniższej tabeli. Jeśli chcesz, możesz później zmienić domenę.

    Domena Cel
    Ogólny Zoptymalizowane pod kątem szerokiego zakresu zadań klasyfikacji obrazów. Jeśli żadna z innych domen nie jest odpowiednia lub nie masz pewności, którą domenę wybrać, wybierz domenę ogólną.
    Żywność Zoptymalizowane pod kątem zdjęć potraw, jak można je zobaczyć w menu restauracji. Jeśli chcesz sklasyfikować zdjęcia pojedynczych owoców lub warzyw, użyj domeny Food.
    Zabytki Zoptymalizowany pod kątem rozpoznawalnych zabytków, zarówno naturalnych, jak i sztucznych. Ta domena działa najlepiej, gdy punkt orientacyjny jest wyraźnie widoczny na zdjęciu. To rozwiązanie działa, nawet jeśli punkt orientacyjny jest częściowo zasłonięty przez ludzi znajdujących się przed nim.
    Detaliczny Zoptymalizowane pod kątem obrazów znajdujących się w katalogu zakupów lub witrynie internetowej zakupów. Jeśli potrzebujesz wysokiej precyzji klasyfikowania między sukienkami, spodniami i koszulami, użyj tej domeny.
    Domeny kompaktowe Zoptymalizowane pod kątem ograniczeń klasyfikacji w czasie rzeczywistym na urządzeniach przenośnych. Modele generowane przez domeny kompaktowe można eksportować do uruchamiania lokalnie.
  5. Na koniec wybierz pozycję Utwórz projekt.

Wybieranie obrazów szkoleniowych

Co najmniej należy użyć co najmniej 30 obrazów na tag w początkowym zestawie treningowym. Powinieneś również zebrać kilka dodatkowych obrazów, aby przetestować model po jego wytrenowaniu.

Aby efektywnie trenować model, użyj obrazów z różnorodnymi elementami wizualnymi. Wybierz obrazy, które różnią się w zależności od:

  • kąt kamery
  • oświetlenie
  • tło
  • styl wizualizacji
  • osoba/zgrupowane podmioty
  • rozmiar
  • typ

Ponadto upewnij się, że wszystkie obrazy szkoleniowe spełniają następujące kryteria:

  • musi mieć format .jpg, .png, .bmp lub .gif
  • rozmiar nie większy niż 6 MB (4 MB dla obrazów przewidywania)
  • nie mniej niż 256 pikseli na najkrótszej krawędzi; wszystkie obrazy krótsze niż 256 pikseli są automatycznie skalowane w górę przez usługę Custom Vision

Przekazywanie i tagowanie obrazów

Możesz przesłać i ręcznie oznaczyć obrazy, aby pomóc w nauczeniu klasyfikatora.

  1. Aby dodać obrazy, wybierz pozycję Dodaj obrazy , a następnie wybierz pozycję Przeglądaj pliki lokalne. Wybierz pozycję Otwórz, aby przejść do tagowania. Wybór tagu jest stosowany do całej przesłanej grupy obrazów, co ułatwia przesyłanie obrazów w osobnych grupach zgodnie z zastosowanymi tagami. Tagi poszczególnych obrazów można również zmienić po ich wgraniu.

    Zrzut ekranu przedstawiający kontrolkę Dodaj obrazy jest wyświetlany w lewym górnym rogu i jako przycisk na dole pośrodku.

  2. Aby utworzyć tag, wprowadź tekst w polu Moje tagi i naciśnij Enter. Jeśli tag już istnieje, zostanie wyświetlony w menu rozwijanym. W projekcie wieloetykietowym można dodać do obrazów więcej niż jeden tag, ale w projekcie wieloklasowym można dodać tylko jeden tag. Aby zakończyć przesyłanie obrazów, użyj przycisku Przekaż [number] pliki.

    Zrzut ekranu przedstawiający stronę przekazywania obrazu z polem umożliwiającym dodawanie tagów.

  3. Po przesłaniu obrazów wybierz Gotowe.

    Zrzut ekranu przedstawiający pasek postępu przedstawiający wszystkie ukończone zadania.

Aby przekazać inny zestaw obrazów, wróć do góry tej sekcji i powtórz te same kroki.

Szkolenie klasyfikatora

Aby wytrenować klasyfikator, wybierz przycisk Trenuj . Klasyfikator używa wszystkich bieżących obrazów do utworzenia modelu identyfikującego cechy wizualne każdego tagu. Ten proces może potrwać kilka minut.

Zrzut ekranu przedstawiający przycisk pociągu w prawym górnym rogu paska narzędzi nagłówka strony internetowej.

Proces trenowania powinien potrwać tylko kilka minut. W tym czasie informacje o procesie trenowania są wyświetlane na karcie Wydajność .

Zrzut ekranu przedstawiający okno przeglądarki ze szczegółami trenowania w sekcji głównej.

Ocena klasyfikatora

Po zakończeniu trenowania wydajność modelu jest szacowana i wyświetlana. Usługa Custom Vision Service używa obrazów przesłanych do trenowania w celu obliczenia precyzji i czułości. Precyzja i czułość to dwa różne pomiary skuteczności klasyfikatora.

  • Precyzja wskazuje ułamek zidentyfikowanych klasyfikacji, które były poprawne. Jeśli na przykład model zidentyfikował 100 obrazów jako psy, a 99 z nich było rzeczywiście psami, precyzja wynosiłaby 99%.
  • Przypomnienie wskazuje ułamek rzeczywistych klasyfikacji, które zostały prawidłowo zidentyfikowane. Jeśli na przykład faktycznie było 100 obrazów jabłek, a model zidentyfikował 80 jako jabłka, kompletność wyniesie 80%.

Zrzut ekranu przedstawiający wyniki szkolenia, pokazujący ogólną dokładność i szybkość odtwarzania oraz dokładność i szybkość odtwarzania dla każdego tagu w klasyfikatorze.

Próg prawdopodobieństwa

Zwróć uwagę na suwak Progu prawdopodobieństwa w lewym okienku zakładki Wydajność. Jest to poziom pewności wymagany, aby przewidywanie było uznane za poprawne (na potrzeby obliczania precyzji i kompletności).

W przypadku interpretowania wywołań przewidywania z progiem wysokiego prawdopodobieństwa, mają tendencję do zwracania wyników o wysokiej precyzji kosztem czułości — wykryte klasyfikacje są poprawne, ale wiele pozostaje niewykrytych. Próg niskiego prawdopodobieństwa jest odwrotny — większość rzeczywistych klasyfikacji jest wykrywana, ale w tym zestawie jest więcej wyników fałszywie dodatnich. Mając to na uwadze, należy ustawić próg prawdopodobieństwa zgodnie z określonymi potrzebami projektu. Później, gdy otrzymujesz wyniki przewidywania po stronie klienta, należy użyć tej samej wartości progu prawdopodobieństwa, jak w tym miejscu.

Zarządzanie iteracjami trenowania

Za każdym razem, gdy trenujesz klasyfikator, należy utworzyć nową iterację ze zaktualizowanymi metrykami wydajności. Wszystkie iteracji można wyświetlić w lewym okienku karty Wydajność . Znajdziesz również przycisk Usuń , którego można użyć do usunięcia iteracji, jeśli jest przestarzała. Usunięcie iteracji powoduje usunięcie wszystkich obrazów, które są z nią unikatowo skojarzone.

Aby dowiedzieć się, jak programistycznie uzyskiwać dostęp do wytrenowanych modeli, zobacz Wywoływanie API przewidywania.

Następny krok

W tym szybkim starcie nauczyłeś się, jak utworzyć i wytrenować model klasyfikacji obrazów przy użyciu portalu internetowego Custom Vision. Następnie uzyskaj więcej informacji na temat iteracyjnego procesu ulepszania modelu.