Korzystanie z głębokiego modelu uczenia Microsoft Cognitive Toolkit w klastrze Spark usługi Azure HDInsight

W tym artykule wykonasz następujące kroki.

Uruchom skrypt niestandardowy, aby zainstalować Microsoft Cognitive Toolkit w klastrze Azure HDInsight Spark.
Przekazywanie notesu Jupyter Notebook do klastra Apache Spark w celu sprawdzenia, jak zastosować wytrenowany model uczenia głębokiego zestawu narzędzi Microsoft Cognitive Toolkit do plików na koncie usługi Azure Blob Storage przy użyciu interfejsu API języka Python platformy Spark (PySpark)

Wymagania wstępne

Klaster Apache Spark w usłudze HDInsight. Zobacz Tworzenie klastra Apache Spark.
Znajomość zagadnień dotyczących używania notesów Jupyter za pomocą platformy Spark w usłudze HDInsight. Aby uzyskać więcej informacji, zobacz Ładowanie danych i uruchamianie zapytań za pomocą platformy Apache Spark w usłudze HDInsight.

Jak działa to rozwiązanie?

To rozwiązanie jest podzielone między ten artykuł a notebook Jupyter dołączony do tego artykułu. W tym artykule wykonasz następujące kroki:

Uruchom akcję skryptu w klastrze HDInsight Spark, aby zainstalować zestaw narzędzi Microsoft Cognitive Toolkit i pakiety języka Python.
Prześlij notes Jupyter uruchamiający rozwiązanie do klastra Spark usługi HDInsight.

Poniższe pozostałe kroki zostały omówione w notesie Jupyter Notebook.

Załaduj przykładowe obrazy do Opornego Rozproszonego Zestawu Danych (RDD) w Spark.
- Załaduj moduły i zdefiniuj ustawienia wstępne.
- Pobierz zestaw danych lokalnie w klastrze Spark.
- Przekonwertuj zestaw danych na RDD.
Ocenianie obrazów przy użyciu wytrenowanego modelu zestawu narzędzi Cognitive Toolkit.
- Pobierz wytrenowany model Cognitive Toolkit do klastra Spark.
- Zdefiniuj funkcje, które mają być używane przez węzły robocze.
- Oceniaj obrazy na węzłach roboczych.
- Ocena dokładności modelu.

Instalowanie zestawu narzędzi Microsoft Cognitive Toolkit

Zestaw narzędzi Microsoft Cognitive Toolkit można zainstalować w klastrze Spark przy użyciu akcji skryptu. Akcja skryptu używa skryptów niestandardowych do instalowania składników w klastrze, które nie są domyślnie dostępne. Możesz użyć niestandardowego skryptu w portalu Azure, przy użyciu .NET SDK usługi HDInsight lub Azure PowerShell. Możesz również użyć skryptu, aby zainstalować zestaw narzędzi w ramach tworzenia klastra lub po uruchomieniu klastra.

W tym artykule użyjemy portalu do zainstalowania zestawu narzędzi po utworzeniu klastra. Aby poznać inne sposoby wykonywania skryptu niestandardowego, zobacz Dostosowywanie klastrów usługi HDInsight przy użyciu akcji skryptu.

Korzystanie z witryny Azure Portal

Aby uzyskać instrukcje dotyczące sposobu uruchamiania akcji skryptu za pomocą witryny Azure Portal, zobacz Dostosowywanie klastrów usługi HDInsight przy użyciu akcji skryptu. Upewnij się, że podasz następujące dane wejściowe, aby zainstalować zestaw narzędzi Microsoft Cognitive Toolkit. Użyj następujących wartości dla akcji skryptu:

Nieruchomość	Wartość
Typ skryptu	- Niestandardowy
Nazwa	Instalowanie programu MCT
Identyfikator URI skryptu powłoki Bash	`https://raw.githubusercontent.com/Azure-Samples/hdinsight-pyspark-cntk-integration/master/cntk-install.sh`
Typy węzłów:	Kierownik, Pracownik
Parametry	Żaden

Prześlij Jupyter Notebook do klastra Spark w usłudze Azure HDInsight

Aby użyć zestawu narzędzi Microsoft Cognitive Toolkit z klastrem Azure HDInsight Spark, należy załadować notes Jupyter Notebook CNTK_model_scoring_on_Spark_walkthrough.ipynb do klastra Spark usługi Azure HDInsight. Ten notes jest dostępny w witrynie GitHub pod adresem https://github.com/Azure-Samples/hdinsight-pyspark-cntk-integration.

Pobierz i rozpakuj https://github.com/Azure-Samples/hdinsight-pyspark-cntk-integration.
W przeglądarce internetowej przejdź do lokalizacji https://CLUSTERNAME.azurehdinsight.net/jupyter, gdzie CLUSTERNAME jest nazwą klastra.
W notesie Jupyter Notebook wybierz opcję Przekaż w prawym górnym rogu, a następnie przejdź do folderu pobierania i wybierz odpowiedni plik CNTK_model_scoring_on_Spark_walkthrough.ipynb.
Ponownie wybierz Załaduj.
Po przekazaniu notesu kliknij nazwę notesu, a następnie postępuj zgodnie z instrukcjami w samym notesie dotyczącymi sposobu ładowania zestawu danych i wykonywania artykułu.

Udostępnij przez

Korzystanie z głębokiego modelu uczenia Microsoft Cognitive Toolkit w klastrze Spark usługi Azure HDInsight

Wymagania wstępne

Jak działa to rozwiązanie?

Instalowanie zestawu narzędzi Microsoft Cognitive Toolkit

Korzystanie z witryny Azure Portal

Prześlij Jupyter Notebook do klastra Spark w usłudze Azure HDInsight

Zobacz też

Scenariusze

Tworzenie i uruchamianie aplikacji

Narzędzia i rozszerzenia

Zarządzanie zasobami

Sprzężenie zwrotne

Dodatkowe źródła