Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
W tym artykule pokazano, jak wytrenować model za pomocą rozwiązania AutoML przy użyciu interfejsu API języka Python w języku AutoML. Aby uzyskać więcej informacji, zobacz Dokumentację interfejsu API języka Python rozwiązania AutoML.
Interfejs API udostępnia funkcje umożliwiające rozpoczęcie klasyfikacji, regresji i prognozowania przebiegów automatycznego uczenia maszynowego. Każde wywołanie funkcji trenuje zestaw modeli i generuje notatnik testowy dla każdego modelu.
Zobacz Wymagania dotyczące eksperymentów rozwiązania AutoML.
Konfigurowanie eksperymentu przy użyciu interfejsu API rozwiązania AutoML
W poniższych krokach ogólnie opisano sposób konfigurowania eksperymentu zautomatyzowanego uczenia maszynowego przy użyciu interfejsu API:
Utwórz notes i dołącz go do klastra z uruchomioną usługą Databricks Runtime ML.
Zidentyfikuj tabelę, której chcesz użyć z istniejącego źródła danych lub przekazać plik danych do systemu plików DBFS i utworzyć tabelę.
Aby uruchomić uruchamianie automatycznego uczenia maszynowego, użyj funkcji
automl.regress(),automl.classify()lubautoml.forecast()i przekaż tabelę wraz z innymi parametrami trenowania. Aby wyświetlić wszystkie funkcje i parametry, zobacz odniesienia do interfejsu API AutoML w języku Python.Uwaga
Funkcja
automl.forecast()jest dostępna tylko do prognozowania w przypadku klasycznych obliczeń.Na przykład:
# Regression example summary = automl.regress(dataset=train_pdf, target_col="col_to_predict") # Classification example summary = automl.classification(dataset=train_pdf, target_col="col_to_predict") # Forecasting example summary = automl.forecast(dataset=train_pdf, target_col="col_to_predic", time_col="date_col", horizon=horizon, frequency="d", output_database="default")Po rozpoczęciu uruchamiania rozwiązania AutoML w konsoli pojawi się adres URL eksperymentu MLflow. Aby śledzić postęp przebiegu, użyj tego adresu URL. Odśwież eksperyment MLflow, aby zobaczyć próby po ich zakończeniu.
Po zakończeniu działania rozwiązania AutoML:
- Użyj linków w podsumowaniu danych wyjściowych, aby przejść do eksperymentu MLflow lub notesu, który wygenerował najlepsze wyniki.
- Użyj linku do notesu eksploracji danych, aby uzyskać wgląd w dane przekazane do rozwiązania AutoML. Możesz również dołączyć ten notes do tego samego klastra i uruchomić go ponownie, aby odtworzyć wyniki lub przeprowadzić dodatkową analizę danych.
- Użyj obiektu podsumowania zwróconego z wywołania rozwiązania AutoML, aby zapoznać się z bardziej szczegółowymi informacjami na temat prób lub załadować model wytrenowany przez daną wersję próbną. Dowiedz się więcej o obiekcie AutoMLSummary.
- Sklonuj dowolny wygenerowany notes z wersji próbnej i uruchom go ponownie, dołączając go do tego samego klastra, aby odtworzyć wyniki. Możesz również wprowadzić niezbędne zmiany, uruchomić je ponownie, aby wytrenować dodatkowe modele i zalogować je do tego samego eksperymentu.
Importowanie notesu
Aby zaimportować notes zapisany jako artefakt MLflow, użyj interfejsu databricks.automl.import_notebook API języka Python. Aby uzyskać więcej informacji, zobacz Importowanie notesu
Rejestrowanie i wdrażanie modelu
Możesz zarejestrować i wdrożyć model trenowany przez AutoML tak samo jak każdy zarejestrowany model w rejestrze modeli MLflow; zobacz Rejestrowanie, ładowanie i logowanie modeli MLflow.
Brak modułu o nazwie pandas.core.indexes.numeric
Podczas obsługi modelu utworzonego przy użyciu rozwiązania AutoML z obsługą modelu może wystąpić błąd: No module named pandas.core.indexes.numeric.
Jest to spowodowane niezgodną pandas wersją między rozwiązaniem AutoML a modelem obsługującym środowisko punktu końcowego. Aby naprawić ten błąd:
-
Pobierz skrypt add-pandas-dependency.py.
Skrypt edytuje element
requirements.txticonda.yamldla zarejestrowanego modelu, aby zawierał odpowiedniąpandaswersję zależności:pandas==1.5.3. - Zmodyfikuj skrypt, aby uwzględnić
run_idprojektu MLflow, w którym zarejestrowano model. - Ponowne wyrejestrowanie modelu do rejestru modeli MLflow.
- Spróbuj użyć nowej wersji modelu MLflow.
Przykład notesu
W poniższym notesie przedstawiono sposób prognozowania za pomocą rozwiązania AutoML.
Przykładowy notes prognozowania automatycznego uczenia maszynowego
Następne kroki
Dokumentacja interfejsu API języka Python rozwiązania AutoML.