本文著重於使用 作業和管線 工作區 UI 建立、設定和編輯工作的指示。
Azure Databricks 會將工作當做 Lakeflow 作業的元件來管理。 一個工作包含一個或多個任務。 您可以藉由設定第一個工作,在工作區 UI 中建立新的作業。 若要設定新的作業,請參閱 設定和編輯 Lakeflow 作業。
每個工作都有一個相關聯的計算資源,可執行工作邏輯。 如果您使用無伺服器,Azure Databricks 會設定計算資源。 如果您未使用無伺服器架構,請參閱設定作業的運算資源。
Azure Databricks 有其他進入點和工作設定的工具,包括以下:
建立或設定工作
若要使用工作區 UI 編輯現有的工作或新增新工作,請使用下列步驟選取現有的作業:
- 在 Azure Databricks 工作區的側邊欄中,點擊 作業和管線。
- 或者,選取 [作業] 和 [我所擁有的] 篩選器。
- 點擊工作的名稱連結。
- 按下 [工作] 索引標籤。工作圖表隨即出現。
- 若要編輯工作,請按下工作名稱。 工作組態會出現在工作圖表下方。
- 若要新增工作,請按下
。
工作類型
組態選項和指令會因工作而異。 以下是可用的工作類型:
- 筆記本
- Python 指令碼
- Python Wheel
- SQL
- 管線
- 儀表板
- Power BI
- dbt
- dbt 平台 (測試版)
- JAR (Java 存檔)
- Spark 提交
- 執行作業
- If/else
- 針對每個
複製任務
複製任務以便拷貝現有任務的所有組態,包括上游依賴關係。
若要複製工作,請執行下列動作:
- 在工作圖表中選取工作。
- 按一下
。 - 指定「已複製工作名稱」,然後按下「複製」。
刪除工作
若要刪除工作,請執行下列動作:
- 在工作圖表中選取工作。
- 按下
並選取 刪除工作。
複製工作路徑
某些工作類型,例如筆記本工作,可讓您將路徑複製到工作原始程式碼:
- 請點擊工作標籤頁。
- 選取包含要複製路徑的任務。
- 按下工作路徑旁的
,將路徑複製到剪貼板。
進階工作設定
下列進階設定可控制失敗工作的重試,以及未回應工作的逾時原則。
注意
您可以在工作或作業層級設定通知。 請參閱 在作業上新增通知。
設定重試原則
工作重試的預設設定取決於作業組態。 一般而言,預設設定在工作失敗時不會重試任何任務。
無伺服器作業預設會自動最佳化重試。 請參閱設定無伺服器計算自動最佳化,以禁止重試
連續作業會使用指數退避重試原則。 請參閱如何處理連續作業的失敗?。
若要設定原則,以確定任務執行重試失敗的時間和次數,請按一下 [重試] 旁邊的 [+ 新增]。
重試間隔以毫秒為單位進行計算,從失敗執行開始到隨後的重試執行。
注意
如果您同時設定 [逾時] 和 [重試],則逾時會套用至每個重試。
設定工作執行期間或串流待辦專案計量的閾值
重要
Lakeflow 作業的串流監控能見度目前處於 公開預覽狀態。
您可以設定工作執行持續時間或串流待辦專案計量的選擇性閾值。 若要設定持續時間臨界值或串流計量閾值,請按一下工作組態面板中 計量閾值。
若要設定任務工期閾值,包括工作的預期和最大完成時間,請在 [
若要設定串流待辦專案計量的臨界值,請選取 [計量] 下拉功能表中的計量,然後輸入閾值的值。 若要瞭解串流來源支援的特定計量,請參閱 檢視串流工作的計量。
在 [ 警告] 欄位中輸入工期,以設定工作的預期完成時間。 如果任務超過此閾值,就會觸發事件。 您可以使用此事件在任務執行緩慢時發出通知。 請參閱 慢速作業通知設定。
若要設定任務的完成時間上限,請在 [逾時] 欄位中輸入最大持續時間。 如果任務未在此時間完成,Azure Databricks 會將其狀態設定為「逾時」。
如果因為超過臨界值而觸發事件,您可以使用 事件來傳送通知。 請參閱 慢速作業通知設定。