次の方法で共有


インジェスト用にデータへのアクセスを構成する

この記事では、管理者ユーザーが Azure Data Lake Storage (ADLS) 内のコンテナー内のデータへのアクセスを構成して、Azure Databricks ユーザーが ADLS から Azure Databricks のテーブルにデータを読み込むことができるようにする方法について説明します。

この記事では、ソース データへのセキュリティで保護されたアクセスを構成する、次の方法について説明します。

  • (推奨) Unity Catalog ボリュームを作成する。
  • ストレージ資格情報を使用して Unity Catalog の外部の場所を作成する。
  • サービス プリンシパルを使用するコンピューティング リソースを起動する。
  • 一時的な資格情報 (BLOB SAS トークン) を生成する。

開始する前に

ADLS 内のデータへのアクセスを構成する前に、次の項目があることを確認してください。

  • Azure Storage アカウントのコンテナーにあるデータ。 コンテナーを作成するには、Azure Storage に関するドキュメントの「コンテナーを作成する」を参照してください。
  • サービス プリンシパルを使用するコンピューティング リソースを使用してデータにアクセスする場合は、Azure Databricks ワークスペースの管理者アクセス許可。
  • 一時的な資格情報を使用してデータにアクセスするには:
    • An Azure Databricks ワークスペース管理者のアクセス許可。
    • BLOB SAS トークンを作成するための Azure アカウントのアクセス許可。 これを使用して、一時的な資格情報を生成できます。

クラウド ストレージへのアクセスを構成する

ADLS へのアクセスを構成するには、次のいずれかの方法を使用します。

  • (推奨) Unity Catalog ボリュームを作成する。 詳細については、「Unity Catalog ボリュームとは」を参照してください。
  • ストレージ資格情報を使用して Unity Catalog の外部の場所を構成する。 外部の場所の詳細については、「 外部の場所の概要」を参照してください。

クリーンアップ

クラウド アカウントおよび Azure Databricks 内の関連するリソースを保持する必要がなくなったら、それらのリソースをクリーンアップできます。

ADLS ストレージ アカウントを削除する

  1. Azure アカウントの Azure portal を開きます (通常は https://portal.azure.com)。
  2. ストレージ アカウントを参照して開きます。
  3. 削除をクリックします。
  4. ストレージ アカウントの名前を入力して、[削除] をクリックします。

SQL ウェアハウスを停止する

他のタスクに SQL ウェアハウスを使用していない場合は、追加コストを回避するために SQL ウェアハウスを停止する必要があります。

  1. SQL ペルソナのサイドバーで、[SQL ウェアハウス] をクリックします。
  2. SQL ウェアハウスの名前の横にある [停止] をクリックします。
  3. メッセージが表示されたら、もう一度 [停止] をクリックします。

次のステップ

この記事の手順を完了すると、ユーザーは COPY INTO コマンドを実行して、ADLS コンテナーから Azure Databricks ワークスペースにデータを読み込むことができます。

  • サービス プリンシパルを使用して SQL ウェアハウスでデータを読み込むには、「COPY INTOを使用した を使用してデータを読み込む」を参照してください。
  • 一時的な資格情報 (BLOB SAS トークン) を使用してデータを読み込む場合は、「一時的な資格情報で COPY INTO を使用してデータを読み込む」を参照してください。