Wybierz odpowiedni docelowy obiekt obliczeniowy
W usłudze Azure Machine Learning docelowe obiekty obliczeniowe to fizyczne lub wirtualne komputery, na których są uruchamiane zadania.
Zrozumienie dostępnych typów zasobów obliczeniowych
Usługa Azure Machine Learning obsługuje wiele typów obliczeń na potrzeby eksperymentowania, trenowania i wdrażania. Mając wiele typów obliczeń, można wybrać najbardziej odpowiedni typ docelowego obiektu obliczeniowego dla Twoich potrzeb.
- Wystąpienie obliczeniowe: zachowuje się podobnie do maszyny wirtualnej i jest głównie używane do uruchamiania notatników. Idealnie nadaje się do eksperymentowania.
- Klastry obliczeniowe: klastry wielowęźleowe maszyn wirtualnych, które są automatycznie skalowane w górę lub w dół w celu spełnienia wymagań. Ekonomiczny sposób uruchamiania skryptów, które muszą przetwarzać duże ilości danych. Klastry umożliwiają również dystrybuowanie obciążenia przy użyciu przetwarzania równoległego i skrócenie czasu potrzebnego do uruchomienia skryptu.
- Klastry Kubernetes: klaster oparty na technologii Kubernetes, zapewniając większą kontrolę nad sposobem konfigurowania i zarządzania obliczeniami. Możesz dołączyć własny klaster usługi Azure Kubernetes (AKS) na potrzeby obliczeń w chmurze lub klaster Kubernetes usługi Arc dla obciążeń lokalnych.
- Dołączone zasoby obliczeniowe: umożliwia dołączanie istniejących zasobów obliczeniowych, takich jak maszyny wirtualne platformy Azure lub klastry usługi Azure Databricks do obszaru roboczego.
- Obliczenia bezserwerowe: w pełni zarządzane zasoby obliczeniowe na żądanie, których można używać do zadań szkoleniowych.
Uwaga / Notatka
Usługa Azure Machine Learning oferuje możliwość tworzenia własnych zasobów obliczeniowych i zarządzania nimi lub korzystania z obliczeń w pełni zarządzanych przez usługę Azure Machine Learning.
Kiedy używać jakiego typu obliczeń?
Ogólnie rzecz biorąc, istnieją pewne najlepsze rozwiązania, które można stosować podczas pracy z celami obliczeniowymi. Aby dowiedzieć się, jak wybrać odpowiedni typ obliczeń, podano kilka przykładów. Należy pamiętać, że typ używanych zasobów obliczeniowych zawsze zależy od określonej sytuacji.
Wybieranie docelowego obiektu obliczeniowego na potrzeby eksperymentowania
Wyobraź sobie, że jesteś analitykiem danych i poproszono Cię o opracowanie nowego modelu uczenia maszynowego. Prawdopodobnie masz niewielki podzbiór danych treningowych, za pomocą których można eksperymentować.
Podczas eksperymentowania i programowania wolisz pracować w notesie Jupyter. Środowisko notesu najbardziej korzysta z zasobów obliczeniowych, które działają nieprzerwanie.
Wielu specjalistów ds. danych jest zaznajomionych z uruchamianiem notebooków na urządzeniu lokalnym. Alternatywą dla chmury zarządzaną przez usługę Azure Machine Learning jest wystąpienie obliczeniowe. Alternatywnie możesz również wybrać bezserwerowe obliczenia platformy Spark do uruchamiania kodu Spark w notesach, jeśli chcesz korzystać z rozproszonej mocy obliczeniowej platformy Spark.
Wybierz docelowy obiekt obliczeniowy dla środowiska produkcyjnego
Po eksperymentowaniu możesz trenować modele, uruchamiając skrypty języka Python, aby przygotować się do produkcji. Skrypty będzie można łatwiej zautomatyzować i zaplanować, abyś mógł stale ponownie trenować model. Skrypty można uruchamiać jako (pipeline) zadania.
Podczas przechodzenia do środowiska produkcyjnego chcesz, aby docelowy obiekt obliczeniowy był gotowy do obsługi dużych ilości danych. Tym więcej danych jest używanych, tym lepiej może być model uczenia maszynowego.
Podczas trenowania modeli za pomocą skryptów chcesz uzyskać docelowy obiekt obliczeniowy na żądanie. Klaster obliczeniowy automatycznie skaluje się w górę, gdy skrypty muszą zostać wykonane, i skaluje w dół po zakończeniu wykonywania skryptu. Jeśli potrzebujesz alternatywy, której nie musisz tworzyć i zarządzać, możesz użyć bezserwerowych obliczeń usługi Azure Machine Learning.
Wybierz docelowy obiekt obliczeniowy do wdrożenia
Typ obliczeń potrzebny podczas używania modelu do generowania przewidywań zależy od tego, czy potrzebujesz przewidywań wsadowych lub w czasie rzeczywistym.
W przypadku przewidywań wsadowych można uruchomić zadanie potoku w usłudze Azure Machine Learning. Zasoby obliczeniowe, takie jak klastry obliczeniowe i przetwarzanie w trybie bezserwerowym usługi Azure Machine Learning, są idealne dla zadań potokowych, ponieważ są dostępne na żądanie i skalowalne.
Jeśli chcesz przewidywać w czasie rzeczywistym, potrzebujesz typu obliczeń, które są uruchomione w sposób ciągły. W związku z tym wdrożenia w czasie rzeczywistym korzystają z bardziej uproszczonego (a tym samym bardziej ekonomicznego) obliczeń. Kontenery są idealne w przypadku wdrożeń w czasie rzeczywistym. Podczas wdrażania modelu w zarządzanym punkcie końcowym online usługa Azure Machine Learning tworzy kontenery i zarządza nimi w celu uruchomienia modelu. Alternatywnie możesz dołączyć klastry Kubernetes, aby zarządzać niezbędnymi obliczeniami do generowania przewidywań w czasie rzeczywistym.