Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Źródło danych eksperymentu MLflow udostępnia standardowy interfejs API do ładowania danych przebiegu eksperymentu MLflow. Możesz załadować dane z eksperymentu notatnika lub użyć nazwy eksperymentu MLflow lub identyfikatora eksperymentu.
Wymagania
Databricks Runtime 6.0 ML lub nowszy.
Ładowanie danych z eksperymentu notatnika
Aby załadować dane z eksperymentu notatnika, użyj load().
Python
df = spark.read.format("mlflow-experiment").load()
display(df)
Scala
val df = spark.read.format("mlflow-experiment").load()
display(df)
Ładowanie danych przy użyciu identyfikatorów eksperymentów
Aby załadować dane z co najmniej jednego eksperymentu obszaru roboczego, określ identyfikatory eksperymentów, jak pokazano.
Python
df = spark.read.format("mlflow-experiment").load("3270527066281272")
display(df)
Scala
val df = spark.read.format("mlflow-experiment").load("3270527066281272,953590262154175")
display(df)
Ładowanie danych przy użyciu nazwy eksperymentu
Możesz również przekazać nazwę eksperymentu do metody load().
Python
expId = mlflow.get_experiment_by_name("/Shared/diabetes_experiment/").experiment_id
df = spark.read.format("mlflow-experiment").load(expId)
display(df)
Scala
val expId = mlflow.getExperimentByName("/Shared/diabetes_experiment/").get.getExperimentId
val df = spark.read.format("mlflow-experiment").load(expId)
display(df)
Filtrowanie danych na podstawie metryk i parametrów
W przykładach w tej sekcji pokazano, jak można filtrować dane po załadowaniu ich z eksperymentu.
Python
df = spark.read.format("mlflow-experiment").load("3270527066281272")
filtered_df = df.filter("metrics.loss < 0.01 AND params.learning_rate > '0.001'")
display(filtered_df)
Scala
val df = spark.read.format("mlflow-experiment").load("3270527066281272")
val filtered_df = df.filter("metrics.loss < 1.85 AND params.num_epochs > '30'")
display(filtered_df)
Schemat
Schemat ramki danych zwracanej przez źródło danych to:
root
|-- run_id: string
|-- experiment_id: string
|-- metrics: map
| |-- key: string
| |-- value: double
|-- params: map
| |-- key: string
| |-- value: string
|-- tags: map
| |-- key: string
| |-- value: string
|-- start_time: timestamp
|-- end_time: timestamp
|-- status: string
|-- artifact_uri: string