ワークスペースでの Databricks アセット バンドルの使用を開始するために、このチュートリアルでは、ジョブを含むバンドルの作成、ジョブのデプロイ、バンドル内でのジョブの実行について説明します。すべてワークスペースから実行します。
ワークスペースでバンドルを使用するための要件については、ワークスペースの 要件の Databricks アセット バンドルを参照してください。
バンドルの詳細については、「 Databricks アセット バンドルとは」を参照してください。
バンドルの作成
まず、Databricks ワークスペースにバンドルを作成します。
バンドルを作成する Git フォルダーに移動します。
ヒント
ワークスペースのエディターで Git フォルダーを以前に開いたことがある場合は、ワークスペース ブラウザーの作成コンテキスト メニューを使用して、Git フォルダーにすばやく移動できます。 「 作成コンテキスト」を参照してください。
[ 作成 ] ボタンをクリックし、[ アセット バンドル] をクリックします。 または、ワークスペース ツリーで Git フォルダーまたはその関連する kebab を右クリックし、 作成>Asset バンドルをクリックします。
[ アセット バンドルの作成 ] ダイアログで、アセット バンドルに名前 ( 完全に素晴らしいバンドルなど) を付けます。 バンドル名には、文字、数字、ダッシュ、アンダースコアのみを含めることができます。 [ 空のプロジェクト ] を選択し、[ 作成して配置 ] をクリックします。
これにより、Git フォルダーに初期バンドルが作成されます。これには、 .gitignore Git 構成ファイルと、必要な Databricks Asset Bundles databricks.yml ファイルが含まれます。
databricks.yml ファイルには、バンドルのメイン構成が含まれています。 詳細については、 Databricks アセット バンドルの構成に関するページを参照してください。
ノートブックを追加する
次に、ノートブックをバンドルに追加します。 次の例のノートブックでは、"Hello World!" が出力されます。
ノートブックバンドルプロジェクトの追加タイルをクリックします。 または、目次でバンドルの kebab をクリックし、[ 作成>Notebook] をクリックします。
ノートブックの名前を helloworld に変更します。
ノートブックの言語を Python に設定し、ノートブックのセルに次のコードを貼り付けます。
print("Hello World!")
ジョブを定義する
次に、ノートブックを実行するジョブを定義します。
バンドルのデプロイ アイコンをクリックして、[ デプロイ ] パネルに切り替えます。
[ バンドル リソース ] セクションで、[ 追加]、[ 新しいジョブ定義] の順にクリックします。
[既存のバンドルにジョブを追加] ダイアログの [ジョブ名] フィールドに「run-notebook」と入力します。 追加とデプロイをクリックします。
開発ターゲット ワークスペースに作成されるジョブ リソースに関する情報を含む [開発へのデプロイ] 確認ダイアログが表示されます。 [デプロイ] をクリックします。
デプロイ アイコンの上にあるフォルダー アイコンをクリックして、バンドルのファイルに戻ります。 ジョブリソース
run-notebook.job.ymlは、ジョブの基本的な YAML と、いくつかの追加のコメントアウトされたサンプル ジョブ タスク YAML を使用して作成されました。ノートブック タスクをジョブ定義に追加します。
run-notebook.job.ymlファイル内の YAML の例を次に置き換えます。resources: jobs: run_notebook: name: run-notebook queue: enabled: true tasks: - task_key: my-notebook-task notebook_task: notebook_path: ../helloworld.ipynb
YAML でのジョブの定義の詳細については、 ジョブを参照してください。 サポートされている他のジョブ タスクの種類の YAML 構文については、「 Databricks Asset Bundles のジョブにタスクを追加する」を参照してください。
バンドルをデプロイする
次に、バンドルをデプロイし、 helloworld ノートブック タスクを含むジョブを実行します。
バンドルの [ターゲット] の下の [デプロイ] ウィンドウで、ドロップダウンをクリックして、
devターゲット ワークスペースがまだ選択されていない場合は選択します。 ターゲット ワークスペースは、バンドルのtargetsのdatabricks.ymlマッピングで定義されます。 Databricks アセット バンドルのデプロイ モードを参照してください。
[ デプロイ ] ボタンをクリックします。 バンドルが検証され、検証の詳細がダイアログに表示されます。
この開発 へのデプロイ の確認ダイアログでデプロイの詳細を確認し、[ デプロイ] をクリックします。
Von Bedeutung
バンドルをデプロイし、バンドル リソースを実行すると、現在のユーザーとしてコードが実行されます。 コマンドを実行する構成設定を含めることができる YAML など、バンドル内のコードを信頼していることを確認します。
配置の状態は、[プロジェクト出力] ウィンドウに 出力 されます。
ジョブの実行
デプロイされたバンドル リソースは、[ バンドル リソース] の下に一覧表示されます。 ジョブ リソースに関連付けられている再生アイコンをクリックして実行します。
左側のナビゲーション バーから [ジョブの実行] に移動して、バンドルの実行を確認します。 バンドル ジョブ実行の名前にはプレフィックスが付きます (例: [dev someone] run-notebook)。