Microsoft Purview では、 データ ソースを登録した後、ソースをスキャンして技術的なメタデータをキャプチャし、スキーマを抽出し、データに分類を適用できます。
- スキャンの詳細については、「 Data Map でのスキャンとインジェスト」を参照してください。
- スキャンのベスト プラクティスを確認します。
この記事では、データ ソースをスキャンするための基本的な手順について説明します。
ヒント
各ソースには、独自の手順とスキャンの前提条件があります。 最も完全なスキャン手順については、 サポートされているソースの一覧からソース を選択し、そのスキャン手順を確認します。
前提条件
Microsoft Purview で登録およびスキャンできるソースの一覧を確認します。
データ ソースをスキャンする前に、次の手順を実行します。
- データ ソースを登録します。 この手順では、基本的に Microsoft Purview にデータ ソースのアドレスを提供し、データ マップ内の コレクションまたはドメイン にマップします。
- ネットワークを検討し、 シナリオに適した統合ランタイム構成を選択します。
- ソースへの接続に使用する資格情報を検討してください。 すべての ソース ページ には、使用可能な認証の種類に関する詳細を含む [スキャン ] セクションがあります。
スキャンを作成する
次の手順では、例として Azure Blob Storage を使用し、Microsoft Purview マネージド ID を使用して認証します。
重要
これらの手順では、スキャンを作成する方法について説明します。 ソース固有の前提条件とスキャン手順については、「 Data Map に接続するデータ ソース」を参照してください。
Microsoft Purview ポータルを開き、[ データ マップ>データ ソース] に移動します。 登録済みのソースは、マップ ビューまたはテーブル ビューで表示できます。
ヒント
Data Map に多数の登録済みソースがある場合は、テーブル ビューのパフォーマンスが向上する可能性があります。
ソースを見つけて、[ 新しいスキャン] を選択します。
スキャンの 名前 を入力します。
[ 資格情報] で、認証方法を選択します。
スキャンの現在のドメイン、コレクション、またはサブコレクションを選択します。 選択するコレクションまたはドメインは、スキャンによって検出されたメタデータが格納される場所です。
注:
スキャンは常に登録済みソースと同じドメインにありますが、サブコレクションを選択できます。
[ 接続のテスト] を選択します。 接続に成功した場合は、[ 続行] を選択します。 接続が成功しない場合の トラブルシューティング に関するページを参照してください。
ソースに応じて、スキャンの範囲を特定のデータのサブセットにすることができます。 Azure Blob Storageの場合は、一覧で適切な項目を選択して、フォルダーとサブフォルダーを選択します。
スキャン ルール セットを選択します。 スキャン ルール セットには、スキャン チェックの 種類のデータ分類が 含まれています。 システムの既定値 (ソースで使用できるすべての分類を含む) を選択するか、organization内の他のユーザーによって行われた既存のカスタム ルール セットを選択するか、新しいルール セットをインラインで作成できます。
注:
ソースを登録したドメインに関連付けられている資格情報とスキャン ルール セットのみを選択できます。
スキャン トリガーを選択します。 スケジュールを設定することも、スキャンを 1 回実行することもできます。 サポートされている スケジュール オプションの詳細については、こちらをご覧ください。
スキャンを確認し、[ 保存して実行] を選択します。
スキャンをスケジュールする
スキャンを設定する場合は、1 回またはオンデマンドで実行するか、定期的なスケジュールを設定するかを選択します。 次のスケジュール オプションを構成できます。
- タイム ゾーン: スキャン スケジュールを調整するタイム ゾーンを選択します。 選択したタイム ゾーンで夏時間が表示される場合、トリガーは差分の自動調整を行います。
-
繰り返し: 毎日、 毎週、または 毎月 のスキャンの繰り返しを選択します。
- 毎日の繰り返し: 繰り返しを X 日ごとに設定し、その日のスキャン開始時刻を指定します。
- 週単位の繰り返し: 繰り返しを X 週ごとに設定し、1 つまたは複数の曜日を選択し、その日のスキャン開始時刻を指定します。
- 毎月の繰り返し: 繰り返しを X か月ごとに設定し、月の日または平日を選択し、月の 1 つまたは複数の日または平日を選択し、その日のスキャン開始時刻を指定します。
- [開始の繰り返し] : スキャン スケジュールが開始されるタイミングを設定します。
- 繰り返しの終了日を指定する (省略可能): 一定時間後にスキャンを停止する場合は、[チェック] ボックスを選択してこのオプションを有効にし、終了日を指定します。
スキャンを表示する
データ ソース内のデータ量によっては、スキャンの実行に時間がかかる場合があります。 進行状況をチェックし、スキャンが完了したときに結果を確認する方法を次に示します。
スキャンは、コレクション、ドメイン、またはソース自体から表示できます。
コレクションまたはドメインから表示するには、データ マップの [コレクション ] または [ドメイン] に移動し、[スキャン] を選択 します。
スキャン名を選択して詳細を表示します。
または、コレクションまたはドメインのデータ ソースに直接移動し、[詳細の表示] を選択してスキャンの状態をチェックすることもできます。
スキャンの詳細には、[ 前回の実行] 状態 でのスキャンの進行状況と、スキャンおよび分類された資産の数 が 表示 されます。
[最終実行状態] は [進行中] に更新され、スキャン全体が正常に実行されると [完了] に更新されます。
スキャンを管理する
スキャンが完了したら、スキャンを管理したり、もう一度実行したりできます。
コレクションの一覧またはソース ページから [ スキャン名 ] を選択して、スキャンを管理します。
もう一度スキャンを実行したり、スキャンを編集したり、スキャンを削除したりできます。
スコープ内のすべてのコンテンツをスキャンするフル スキャンを実行できます。 一部のソースには、 増分スキャン オプションもあります。 増分スキャンでは、前回のスキャン以降に更新されたリソースのみがスキャンされます。 ソース ページで サポートされている機能 テーブルを確認して、最初のスキャン後にソースで増分スキャンを使用できるかどうかを確認します。
トラブルシューティング
スキャンの接続の設定は、ネットワークと資格情報のカスタム 設定であるため、複雑になる可能性があります。
ソースに接続できない場合は、次の手順に従います。
- ソース ページの前提条件を確認して、何も見逃さないことを確認します。
- ソース ページの [スキャン ] セクションで認証オプションを確認して、認証方法を正しく設定していることを確認します。
- 接続のトラブルシューティングを確認します。
- サポート リクエストを作成して、サポート チームが特定の環境のトラブルシューティングを支援できるようにします。