次の方法で共有


データ マップでデータ ソースをスキャンする

Microsoft Purview では、 データ ソースを登録した後、ソースをスキャンして技術的なメタデータをキャプチャし、スキーマを抽出し、データに分類を適用できます。

この記事では、データ ソースをスキャンするための基本的な手順について説明します。

ヒント

各ソースには、独自の手順とスキャンの前提条件があります。 最も完全なスキャン手順については、 サポートされているソースの一覧からソース を選択し、そのスキャン手順を確認します。

前提条件

Microsoft Purview で登録およびスキャンできるソースの一覧を確認します。

データ ソースをスキャンする前に、次の手順を実行します。

  1. データ ソースを登録します。 この手順では、基本的に Microsoft Purview にデータ ソースのアドレスを提供し、データ マップ内の コレクションまたはドメイン にマップします。
  2. ネットワークを検討し、 シナリオに適した統合ランタイム構成を選択します
  3. ソースへの接続に使用する資格情報を検討してください。 すべての ソース ページ には、使用可能な認証の種類に関する詳細を含む [スキャン ] セクションがあります。

スキャンを作成する

次の手順では、例として Azure Blob Storage を使用し、Microsoft Purview マネージド ID を使用して認証します。

重要

これらの手順では、スキャンを作成する方法について説明します。 ソース固有の前提条件とスキャン手順については、「 Data Map に接続するデータ ソース」を参照してください。

  1. Microsoft Purview ポータルを開き、[ データ マップ>データ ソース] に移動します。 登録済みのソースは、マップ ビューまたはテーブル ビューで表示できます。

    ヒント

    Data Map に多数の登録済みソースがある場合は、テーブル ビューのパフォーマンスが向上する可能性があります。

  2. ソースを見つけて、[ 新しいスキャン] を選択します。

  3. スキャンの 名前 を入力します。

  4. [ 資格情報] で、認証方法を選択します。

  5. スキャンの現在のドメイン、コレクション、またはサブコレクションを選択します。 選択するコレクションまたはドメインは、スキャンによって検出されたメタデータが格納される場所です。

    注:

    スキャンは常に登録済みソースと同じドメインにありますが、サブコレクションを選択できます。

  6. [ 接続のテスト] を選択します。 接続に成功した場合は、[ 続行] を選択します。 接続が成功しない場合の トラブルシューティング に関するページを参照してください。

  7. ソースに応じて、スキャンの範囲を特定のデータのサブセットにすることができます。 Azure Blob Storageの場合は、一覧で適切な項目を選択して、フォルダーとサブフォルダーを選択します。

    ファイルとフォルダーが選択されたスキャン ウィンドウのスコープを示すスクリーンショット。

  8. スキャン ルール セットを選択します。 スキャン ルール セットには、スキャン チェックの 種類のデータ分類が 含まれています。 システムの既定値 (ソースで使用できるすべての分類を含む) を選択するか、organization内の他のユーザーによって行われた既存のカスタム ルール セットを選択するか、新しいルール セットをインラインで作成できます。

    注:

    ソースを登録したドメインに関連付けられている資格情報とスキャン ルール セットのみを選択できます。

  9. スキャン トリガーを選択します。 スケジュールを設定することも、スキャンを 1 回実行することもできます。 サポートされている スケジュール オプションの詳細については、こちらをご覧ください。

  10. スキャンを確認し、[ 保存して実行] を選択します。

スキャンをスケジュールする

スキャンを設定する場合は、1 回またはオンデマンドで実行するか、定期的なスケジュールを設定するかを選択します。 次のスケジュール オプションを構成できます。

  • タイム ゾーン: スキャン スケジュールを調整するタイム ゾーンを選択します。 選択したタイム ゾーンで夏時間が表示される場合、トリガーは差分の自動調整を行います。
  • 繰り返し: 毎日毎週、または 毎月 のスキャンの繰り返しを選択します。
    • 毎日の繰り返し: 繰り返しを X 日ごとに設定し、その日のスキャン開始時刻を指定します。
    • 週単位の繰り返し: 繰り返しを X 週ごとに設定し、1 つまたは複数の曜日を選択し、その日のスキャン開始時刻を指定します。
    • 毎月の繰り返し: 繰り返しを X か月ごとに設定し、月の日または平日を選択し、月の 1 つまたは複数の日または平日を選択し、その日のスキャン開始時刻を指定します。
  • [開始の繰り返し] : スキャン スケジュールが開始されるタイミングを設定します。
  • 繰り返しの終了日を指定する (省略可能): 一定時間後にスキャンを停止する場合は、[チェック] ボックスを選択してこのオプションを有効にし、終了日を指定します。

スキャン トリガーの設定ページのスクリーンショット。

スキャンを表示する

データ ソース内のデータ量によっては、スキャンの実行に時間がかかる場合があります。 進行状況をチェックし、スキャンが完了したときに結果を確認する方法を次に示します。

  1. スキャンは、コレクション、ドメイン、またはソース自体から表示できます。

  2. コレクションまたはドメインから表示するには、データ マップの [コレクション ] または [ドメイン] に移動し、[スキャン] を選択 します

    [スキャン] ボタンが強調表示されているコレクション ページのスクリーンショット。

  3. スキャン名を選択して詳細を表示します。

    最新のスキャン名が強調表示されているコレクション リスト内のスキャンのスクリーンショット。

  4. または、コレクションまたはドメインデータ ソースに直接移動し、[詳細の表示] を選択してスキャンの状態をチェックすることもできます。

    ソースの [ビューの詳細] ボタンが強調表示されている Data Map のスクリーンショット。

  5. スキャンの詳細には、[ 前回の実行] 状態 でのスキャンの進行状況と、スキャンおよび分類された資産の数 表示 されます

    アセットとスキャンが強調表示されているソース詳細ページのスクリーンショット。

  6. [最終実行状態][進行中] に更新され、スキャン全体が正常に実行されると [完了] に更新されます。

    進行中の状態を示すスキャンを含むソースの詳細ページのスクリーンショット。

    完了した状態を示すスキャンを含むソースの詳細ページのスクリーンショット。

スキャンを管理する

スキャンが完了したら、スキャンを管理したり、もう一度実行したりできます。

  1. コレクションの一覧またはソース ページから [ スキャン名 ] を選択して、スキャンを管理します。

    [スキャン名] リンクが強調表示されているソースの詳細ページのスクリーンショット。

  2. もう一度スキャンを実行したり、スキャンを編集したり、スキャンを削除したりできます。

    実行、編集、削除のボタンが強調表示された [スキャンの管理] ページのスクリーンショット。

  3. スコープ内のすべてのコンテンツをスキャンするフル スキャンを実行できます。 一部のソースには、 増分スキャン オプションもあります。 増分スキャンでは、前回のスキャン以降に更新されたリソースのみがスキャンされます。 ソース ページで サポートされている機能 テーブルを確認して、最初のスキャン後にソースで増分スキャンを使用できるかどうかを確認します。

    [今すぐスキャンを実行] ボタンのスクリーンショット。完全なスキャン オプションと増分スキャン オプションが表示されています。

トラブルシューティング

スキャンの接続の設定は、ネットワークと資格情報のカスタム 設定であるため、複雑になる可能性があります。

ソースに接続できない場合は、次の手順に従います。

  1. ソース ページの前提条件を確認して、何も見逃さないことを確認します。
  2. ソース ページの [スキャン ] セクションで認証オプションを確認して、認証方法を正しく設定していることを確認します。
  3. 接続のトラブルシューティングを確認します
  4. サポート リクエストを作成して、サポート チームが特定の環境のトラブルシューティングを支援できるようにします。

次の手順