Snowflake データ ソースをスキャンする場合、Microsoft Purview では、次のような技術的なメタデータの抽出がサポートされます。
- サーバー、データベース、スキーマ、およびテーブル (列を含む)。列、外部キー、および一意の制約を含むビュー。
- パラメーター データセットと結果セットを含むストアド プロシージャ。
- パラメーター データセットを含む関数。
- 列を含むパイプ、ステージ、ストリーム。
- タスクとシーケンス。
Data Map に Snowflake ソースを登録する
Microsoft Purview 統合カタログで新しい Snowflake ソースを登録するには、次の手順に従います。
- [Microsoft Purview ポータル] にサインインします。
- [Data Map solution]\(データ マップ ソリューション\) カードを選択します。 Data Map ソリューション カードが表示されない場合は、[すべてのソリューションを表示] を選択し、[コア] セクションから [データ マップ] を選択します。
- [登録] を選択します。
- [ ソースの登録] で、[ Snowflake] を選択します。
データ マップ スキャンを設定する
- 登録されている Snowflake ソースを選択します。
- [+ 新しいスキャン] を選択します。
- 次のユーザー詳細を入力します。
- [名前]: スキャンの名前。
- 統合ランタイム経由で接続する: シナリオに応じて、自動解決された統合ランタイム、マネージド Virtual Network IR、または SHIR Azureを選択します。
- 接続のホスト: スキャン中に Snowflake への接続を確立するために使用するエンドポイントを選択します。 サーバー URL、またはデータ ソースで構成した他のホストから選択できます。
- 資格情報: データ ソースに接続する資格情報を選択します。 次のことを確認してください。
- 資格情報の作成時に [基本認証] を選択します。
- [ユーザー名] 入力フィールドに、Snowflake への接続に使用するユーザー名を指定します。
- Snowflake への接続に使用するユーザー パスワードを秘密キーに格納します。
- Warehouse: 大文字と小文字を区別してスキャンを強化するために使用するウェアハウス インスタンスの名前を指定します。 資格情報で指定されたユーザーに割り当てられた既定のロールには、このウェアハウスに対する USAGE 権限が必要です。
- データベース: 大文字と小文字を区別してインポートする 1 つ以上のデータベース インスタンス名を指定します。 リスト内の名前はセミコロン (;)で区切ります。 たとえば、DB1 です。DB2。 資格情報で指定されたユーザーに割り当てられた既定のロールには、データベース オブジェクトに対する適切な権限が必要です。
- スキーマ: インポートするスキーマのサブセットをセミコロン区切りリストとして一覧表示します。
- [接続のテスト] を選択して設定を検証します (Azure Integration Runtimeを使用する場合に使用できます)。
- [続行] を選択します。
- 分類用のスキャン ルール セットを選択します。 システムの既定値、既存のカスタム ルール セット、または新しいルール セットをインラインで作成することができます。
- スキャンを確認し、[ 保存して実行] を選択します。
スキャンすると、Snowflake のデータ資産が統合カタログ検索で使用できるようになります。 Microsoft Purview で Snowflake に接続して管理する方法の詳細については、「Microsoft Purview で Snowflake に接続して管理する」を参照してください。
重要
データ ソースからオブジェクトを削除しても、後続のスキャンでは、Microsoft Purview の対応する資産は自動的に削除されません。
データ品質スキャン用に Snowflake データ ソースへの接続を設定する
この時点で、スキャンされた資産はカタログ化とガバナンスの準備が整います。 スキャンした資産をガバナンス ドメイン Sele のデータ製品に関連付けます。 [データ品質] タブで、新しいAzure SQLデータベース接続を追加します。手動で入力したデータベース名を取得します。
Microsoft Purview ポータルで、統合カタログを開きます。
[ 正常性管理] で、[ データ品質] を選択します。
一覧からガバナンス ドメインを選択し、[管理] ドロップダウン リストから [接続] を選択します。
[接続] ページで 接続 を構成します。
- 接続名と説明を追加します。
- ソースの種類 Snowflake を選択します。
- サーバー名、ウェアハウス名、データベース名、スキーマ名、テーブル名を追加します。
- [認証方法 - 基本認証] を選択します。
- ユーザー名を追加します。
- 資格情報の追加:
- サブスクリプションAzure追加する
- キー コンテナー接続
- シークレット名
- シークレット バージョン
- Snowflake がAzure Virtual Networkで実行されている場合は、[マネージド V-Net を有効にする] チェック ボックスをオンにします。
- [Azure リージョン] を選択します。
- リソース ID Private Link追加します。
- 完全修飾ドメイン名を追加します。
接続をテストして、動作することを確認します。 Virtual Networkを使用している場合、テスト接続機能はサポートされていません。
ターゲットの Snowflake プライベート リンクのリソース ID は、次の形式になります: /subscriptions/(subscription_id)/resourcegroups/az(region)-privatelink/providers/microsoft.network/privatelinkservices/sf-pvlinksvc-az(region)。
- リージョン ID と完全修飾名を取得するには、
SYSTEM_WHITE_LISTとSYSTEM_WHITE_LIST_PRIVATELINKを実行して、パブリック ホストと許可リスト ホストのSNOWFLAKE_DEPLOYMENT、SNOWFLAKE_DEPLOYMENT_REGIONLESS、OCSP_CACHEの値を取得します。 - サブスクリプション ID を取得するには、
ACCOUNTADMINとしてSYSTEM$GET_SNOWFLAKE_PLATFORM_INFO()を実行して、snowflake-vnet-subnet-ids 値を取得します。 Snowflake のAzure テナントのPrivate Linkのサブスクリプション ID は、ここから取得されます。
重要
- プライベート エンドポイント接続の要求が作成されたら、プライベート エンドポイント接続を承認するために、Snowflake サポートでサポート チケットを発行する必要があります。 Snowflake チームが承認するこのサポート チケットに、マネージド プライベート エンドポイント リソース ID の詳細を指定します。
- データ品質スチュワードは、データ品質接続を設定するために Snowflake への 読み取り専用アクセス権 を必要とします。
- Snowflake コネクタは 、https:// を受け入れられません。 データ ソース接続を構成するためにサーバー名を追加するときに、 https:// を削除します。
- パブリック アクセスが無効になっている場合は、[信頼できる Microsoft サービスのKey Vaultを許可する] を選択する必要があります。 これは、Snowflake ワークスペースではなく、Key Vaultにのみ必要です。
注:
Snowflake データベース接続の Open Authorization (OAuth) とキー ペアのサポートが追加されます。 Snowflake でサポートされている OAuth とキー ペアベースの認証メカニズムを使用すると、異なる認証メカニズムをサポートする複数の接続を作成できます。 このような場合、最後に作成された接続を選択するロジックが保持されます。 たとえば、最初にキー ペア ベースの接続を作成し、その後に OAuth を作成した場合、OAuth が選択されます。 キー ペア接続を取得する場合は、OAuth メカニズムを削除する必要があります。 Microsoft Purview データ品質 スキャン用に新しい Snowflake 認証モデルをプレビューする場合は、Microsoft アカウントの担当者にお問い合わせください。
Snowflake でのデータのプロファイリングとデータ品質スキャン
接続を設定したら、データのプロファイリング、ルールの作成と適用、Snowflake でのデータのデータ品質スキャンの実行を行うことができます。 次のドキュメントで説明されている詳細なガイドラインに従います。