次の方法で共有


Microsoft Fabric を使用して Unity カタログに登録されているデータを読み取る

この記事では、Microsoft Fabric を使用して Unity カタログに登録されているデータを読み取る方法の概要について説明します。

Fabric と Unity カタログの統合の概要

Azure Databricks では、Azure Data Lake Storage を使用して、オープン、アクセス可能、低コストのストレージを実現します。 Unity Catalog では、ユーザー定義ポリシーに基づいてそのデータが管理および管理されます。 Microsoft Fabric を使用すると、ユーザーはファイル ショートカットを使用して Unity カタログに登録されているこれらのテーブルの一部を読み取ります。

ユーザーが Fabric から Unity カタログに登録されたデータを読み取るために、Fabric カタログ管理者は、Unity カタログに登録されているデータを指す OneLake ショートカットを作成します。 ファブリック共有機能では、Unity カタログのオープン API を使用して最初に通信を確立し、サポートされているテーブル用の基盤のストレージパスにアクセスできる資格情報を提供します。 ハンドシェイクが確認されると、Fabric は Azure Data Lake Storage に格納されているデータへの OneLake ショートカットを作成します。 Unity カタログによって提供される資格情報は有効期間が短く、1 時間ごとに更新され、Unity カタログを使用して取り消して Fabric ユーザー アクセスを拒否できます。

Fabric を使用して Unity カタログに登録されているデータを読み取る場合は、次の点を理解しておくことが重要です。

  • Fabric の "ミラー化された Azure Databricks カタログ" 項目は、データをレプリケートしません。 データにアクセスするための資格情報は、Unity カタログ API を使用してファブリック エンジンからオンデマンドでフェッチされます。 Databricks は、Lakehouse アーキテクチャに基づくオープン プラットフォームを提供します。データ コピーは必要ありません。また、推奨もされません。
  • ファブリック エンジンは、実際のデータのクエリを実行するユーザーではなく、接続を構成したユーザーの ID に関連付けられた有効期間の短い資格情報を使用して、Unity カタログで承認を実行します。 ファブリック エンジンは、Unity カタログのガバナンスとセキュリティ ポリシーを Fabric ユーザーに適用しません。 言い換えると、テーブルが Fabric で公開されている場合、そのテーブルの Unity カタログ管理アクセス制御は Fabric ユーザーに適用されません。 これにより、企業の情報セキュリティ ポリシーに違反する可能性があります。

開始する前に

Fabric を使用して Unity カタログ データにアクセスするには、Fabric から Databricks への接続を構成するユーザーに、Unity カタログオープン API 資格情報の自動販売機を使用して一時的な資格情報を取得するアクセス許可が必要です。

そのためには、構成ユーザーが、Fabric からアクセスするテーブルを含む Unity カタログのスキーマに対する EXTERNAL USE SCHEMA 特権を持っている必要があります。 「Unity Catalog への外部データ アクセスを有効にする」を参照してください。

接続が確立されると、接続にアクセスできるダウンストリーム Fabric ユーザーは、この特権を持つ必要はなく、Unity カタログ のガバナンスを効果的にバイパスできます。

制限事項

Fabric を使用して Unity カタログに登録されているデータを読み取る場合、以下はサポートされません。

  • Fabric のダウンストリーム ユーザーに対する既存の Unity カタログ セキュリティ ポリシー。
  • ビュー、具体化されたビュー、ストリーミング テーブル。
  • 差分共有カタログ。
  • Lakehouse フェデレーション カタログ。
  • 行レベルのフィルターまたは列マスクが有効になっているテーブル。
  • 形式として Delta Lake を使用しないテーブル。
  • Fabric で実行される操作の Unity カタログ系列。
  • プライベート エンドポイントまたは IP アクセス リストを使用する Azure Databricks ワークスペース。
  • 基になる Azure Data Lake Storage がファイアウォールの内側にあるテーブル。

Fabric を使用するには、メタデータ のスキャンと更新を実行するために実行中の Fabric 容量も必要です。これにより、追加コストが発生します。

これらの制限は、Unity カタログ登録済みデータで Power BI Direct Query を使用する場合には適用されません。 Unity カタログに登録されているデータにアクセスする方法については、「Alternatives」を参照してください。

Fabric を使用して Unity カタログ データを読み取る方法

完全な手順については、 Microsoft の Fabric ショートカットの構成に関するドキュメントを参照してください

Unity カタログに登録されているデータにアクセスするための代替手段

Azure Databricks では、Azure Data Lake Storage を使用して、オープン、アクセス可能、低コストのストレージを実現します。 Unity カタログを使用した Azure クラウド ストレージのベスト プラクティスの詳細について説明します。 ファブリック共有機能に関連するリスクの露出と制限に問題がある場合、Databricks では、Unity カタログに登録されているデータにアクセスするための次のパスをお勧めします。