次の方法で共有


チュートリアル: ワークスペースでバンドルを作成してデプロイする

ワークスペースでの Databricks アセット バンドルの使用を開始するために、このチュートリアルでは、ジョブを含むバンドルの作成、ジョブのデプロイ、バンドル内でのジョブの実行について説明します。すべてワークスペースから実行します。

ワークスペースでバンドルを使用するための要件については、ワークスペースの 要件の Databricks アセット バンドルを参照してください。

バンドルの詳細については、「 Databricks アセット バンドルとは」を参照してください。

バンドルの作成

まず、Databricks ワークスペースにバンドルを作成します。

  1. バンドルを作成する Git フォルダーに移動します。

    ヒント

    ワークスペースのエディターで Git フォルダーを以前に開いたことがある場合は、ワークスペース ブラウザーの作成コンテキスト メニューを使用して、Git フォルダーにすばやく移動できます。 「 作成コンテキスト」を参照してください。

  2. [ 作成 ] ボタンをクリックし、[ アセット バンドル] をクリックします。 または、ワークスペース ツリーで Git フォルダーまたはその関連する kebab を右クリックし、 作成>Asset バンドルをクリックします。

    アセット バンドルを作成する

  3. [ アセット バンドルの作成 ] ダイアログで、アセット バンドルに名前 ( 完全に素晴らしいバンドルなど) を付けます。 バンドル名には、文字、数字、ダッシュ、アンダースコアのみを含めることができます。 [ 空のプロジェクト ] を選択し、[ 作成して配置 ] をクリックします。

    [新しいアセット バンドルの作成] ダイアログ

これにより、Git フォルダーに初期バンドルが作成されます。これには、 .gitignore Git 構成ファイルと、必要な Databricks Asset Bundles databricks.yml ファイルが含まれます。 databricks.yml ファイルには、バンドルのメイン構成が含まれています。 詳細については、 Databricks アセット バンドルの構成に関するページを参照してください。

新しいアセット バンドル

ノートブックを追加する

次に、ノートブックをバンドルに追加します。 次の例のノートブックでは、"Hello World!" が出力されます。

  1. ノートブックバンドルプロジェクトの追加タイルをクリックします。 または、目次でバンドルの kebab をクリックし、[ 作成>Notebook] をクリックします。

  2. ノートブックの名前を helloworld に変更します。

  3. ノートブックの言語を Python に設定し、ノートブックのセルに次のコードを貼り付けます。

    print("Hello World!")
    

ジョブを定義する

次に、ノートブックを実行するジョブを定義します。

  1. バンドルのデプロイ アイコンをクリックして、[ デプロイ ] パネルに切り替えます。

    [デプロイ] パネル アイコン

  2. [ バンドル リソース ] セクションで、[ 追加]、[ 新しいジョブ定義] の順にクリックします。

    ジョブ定義を作成する

  3. [既存のバンドルにジョブを追加] ダイアログの [ジョブ] フィールドに「run-notebook」と入力します。 追加とデプロイをクリックします。

  4. 開発ターゲット ワークスペースに作成されるジョブ リソースに関する情報を含む [開発へのデプロイ] 確認ダイアログが表示されます。 [デプロイ] をクリックします。

  5. デプロイ アイコンの上にあるフォルダー アイコンをクリックして、バンドルのファイルに戻ります。 ジョブリソース run-notebook.job.yml は、ジョブの基本的な YAML と、いくつかの追加のコメントアウトされたサンプル ジョブ タスク YAML を使用して作成されました。

  6. ノートブック タスクをジョブ定義に追加します。 run-notebook.job.yml ファイル内の YAML の例を次に置き換えます。

    resources:
      jobs:
        run_notebook:
          name: run-notebook
          queue:
            enabled: true
          tasks:
            - task_key: my-notebook-task
              notebook_task:
                notebook_path: ../helloworld.ipynb
    

    ジョブ ノートブック タスク構成 YAML

YAML でのジョブの定義の詳細については、 ジョブを参照してください。 サポートされている他のジョブ タスクの種類の YAML 構文については、「 Databricks Asset Bundles のジョブにタスクを追加する」を参照してください。

バンドルをデプロイする

次に、バンドルをデプロイし、 helloworld ノートブック タスクを含むジョブを実行します。

  1. バンドルの [ターゲット] の下の [デプロイ] ウィンドウで、ドロップダウンをクリックして、devターゲット ワークスペースがまだ選択されていない場合は選択します。 ターゲット ワークスペースは、バンドルのtargetsdatabricks.yml マッピングで定義されます。 Databricks アセット バンドルのデプロイ モードを参照してください。

    ターゲットデプロイを選択する

  2. [ デプロイ ] ボタンをクリックします。 バンドルが検証され、検証の詳細がダイアログに表示されます。

  3. この開発 へのデプロイ の確認ダイアログでデプロイの詳細を確認し、[ デプロイ] をクリックします。

    [開発環境にデプロイ] ダイアログ

    Von Bedeutung

    バンドルをデプロイし、バンドル リソースを実行すると、現在のユーザーとしてコードが実行されます。 コマンドを実行する構成設定を含めることができる YAML など、バンドル内のコードを信頼していることを確認します。

配置の状態は、[プロジェクト出力] ウィンドウに 出力 されます。

ジョブの実行

デプロイされたバンドル リソースは、[ バンドル リソース] の下に一覧表示されます。 ジョブ リソースに関連付けられている再生アイコンをクリックして実行します。

デプロイされたリソースを一覧表示する

左側のナビゲーション バーから [ジョブの実行] に移動して、バンドルの実行を確認します。 バンドル ジョブ実行の名前にはプレフィックスが付きます (例: [dev someone] run-notebook)。

次のステップ