這很重要
這項功能目前處於 公開預覽版。 您可以在 預覽 頁面確認預覽報名。 請參閱 管理 Azure Databricks 預覽。
在 系統資料表中使用 MLflow 中繼資料,您可以建置 儀錶板 來分析 MLflow 實驗,並從整個工作區執行。 針對這些工作使用現有的 MLflow UI 和 REST API 需要廣泛且耗時的反覆專案。
單一執行詳細資料的儀表板
若要開始視覺化您的 MLflow 資料,請將 此範例儀錶板 下載為 JSON 檔案,並將 它匯入您的工作區。 此儀錶板包含資料骨架,以複寫 MLflow UI 中執行詳細數據頁面上顯示的內容。
針對指定的實驗 ID、執行 ID 和計量名稱,它會顯示執行詳細資料以及標籤、參數和計量圖表。 您可以從執行詳細資料頁面取得實驗識別碼和執行識別碼,無論是從 UI 還是在 URL 本身中: https://<workspace>.databricks.com/ml/experiments/<experiment_id>/runs/<run_id>。
如果您從左側導覽功能表導覽至儀表板面板,則可以 從此處的 JSON 檔案定義匯入儀表板。 從那裡,您可以使用頂部的輸入框來篩選工作區中的相關運行和實驗以繪製。 請隨意探索查詢並更改情節以滿足您的需求。
儀表板可監控實驗中的平均 GPU 使用率
在上述儀表板的第四個索引標籤上,您可以輸入計量名稱,以取得在指定時間範圍內具有該計量的所有實驗的摘要統計資料。 這項資訊可用於監視 MLflow 在工作區中記錄的 系統計量 ,以監視效率低下的 CPU、記憶體或 GPU 使用率。
在範例中,我們可以看到幾個平均 GPU 利用率低於 10% 的實驗,我們可能想要對其進行調查。