共用方式為


在 Lakeflow 作業中設定和編輯任務

本文著重於使用 作業和管線 工作區 UI 建立、設定和編輯工作的指示。

Azure Databricks 會將工作當做 Lakeflow 作業的元件來管理。 一個工作包含一個或多個任務。 您可以藉由設定第一個工作,在工作區 UI 中建立新的作業。 若要設定新的作業,請參閱 設定和編輯 Lakeflow 作業

每個工作都有一個相關聯的計算資源,可執行工作邏輯。 如果您使用無伺服器,Azure Databricks 會設定計算資源。 如果您未使用無伺服器架構,請參閱設定作業的運算資源

Azure Databricks 有其他進入點和工作設定的工具,包括以下:

建立或設定工作

若要使用工作區 UI 編輯現有的工作或新增新工作,請使用下列步驟選取現有的作業:

  1. 在 Azure Databricks 工作區的側邊欄中,點擊 作業和管線
  2. 或者,選取 [作業] 和 [我所擁有的] 篩選器。
  3. 點擊工作的名稱連結。
  4. 按下 [工作] 索引標籤。工作圖表隨即出現。
  5. 若要編輯工作,請按下工作名稱。 工作組態會出現在工作圖表下方。
  6. 若要新增工作,請按下 [新增工作] 按鈕

工作類型

組態選項和指令會因工作而異。 以下是可用的工作類型:

複製任務

複製任務以便拷貝現有任務的所有組態,包括上游依賴關係。

若要複製工作,請執行下列動作:

  1. 在工作圖表中選取工作。
  2. 按一下 複製任務的按鈕
  3. 指定「已複製工作名稱」,然後按下「複製」

刪除工作

若要刪除工作,請執行下列動作:

  1. 在工作圖表中選取工作。
  2. 按下 垃圾桶 並選取 刪除工作

複製工作路徑

某些工作類型,例如筆記本工作,可讓您將路徑複製到工作原始程式碼:

  1. 請點擊工作標籤頁。
  2. 選取包含要複製路徑的任務。
  3. 按下工作路徑旁的 作業複製圖示,將路徑複製到剪貼板。

進階工作設定

下列進階設定可控制失敗工作的重試,以及未回應工作的逾時原則。

注意

您可以在工作或作業層級設定通知。 請參閱 在作業上新增通知

設定重試原則

工作重試的預設設定取決於作業組態。 一般而言,預設設定在工作失敗時不會重試任何任務。

無伺服器作業預設會自動最佳化重試。 請參閱設定無伺服器計算自動最佳化,以禁止重試

連續作業會使用指數退避重試原則。 請參閱如何處理連續作業的失敗?

若要設定原則,以確定任務執行重試失敗的時間和次數,請按一下 [重試] 旁邊的 [+ 新增]。

重試間隔以毫秒為單位進行計算,從失敗執行開始到隨後的重試執行。

注意

如果您同時設定 [逾時] 和 [重試],則逾時會套用至每個重試。

設定工作執行期間或串流待辦專案計量的閾值

重要

Lakeflow 作業的串流監控能見度目前處於 公開預覽狀態

您可以設定工作執行持續時間或串流待辦專案計量的選擇性閾值。 若要設定持續時間臨界值或串流計量閾值,請按一下工作組態面板中 計量閾值

若要設定任務工期閾值,包括工作的預期和最大完成時間,請在 [ 計量] 下拉功能表中選取 [執行工期] 。 在 [ 警告] 欄位中輸入工期,以設定工作的預期完成時間。 如果工作執行超過此閾值,就會觸發事件。 若要設定任務的完成時間上限,請在 [逾時] 欄位中輸入最大持續時間。 如果任務未在此時間完成,Azure Databricks 會將其狀態設定為「逾時」。

若要設定串流待辦專案計量的臨界值,請選取 [計量] 下拉功能表中的計量,然後輸入閾值的值。 若要瞭解串流來源支援的特定計量,請參閱 檢視串流工作的計量

在 [ 警告] 欄位中輸入工期,以設定工作的預期完成時間。 如果任務超過此閾值,就會觸發事件。 您可以使用此事件在任務執行緩慢時發出通知。 請參閱 慢速作業通知設定

若要設定任務的完成時間上限,請在 [逾時] 欄位中輸入最大持續時間。 如果任務未在此時間完成,Azure Databricks 會將其狀態設定為「逾時」。

如果因為超過臨界值而觸發事件,您可以使用 事件來傳送通知。 請參閱 慢速作業通知設定