次の方法で共有


セルフサービス分析と分析情報

セルフサービス分析と分析情報は、ビジネス ユーザーがデータに個別にアクセスし、分析し、データから分析情報を生成できるようにするデータ、ツール、プラットフォームを指します。 Microsoft Purview データ ガバナンスは、メタデータのドメイン モデルを Microsoft Fabric OneLake と Microsoft Azure Data Lake Storage Gen2に公開するため、独自のツールとコンピューティングを使用して分析および分析情報を生成できます。 データ ガバナンス メタデータのセルフサービス分析は、データ資産の正常性管理の継続的な改善を推進し、データ資産の分析情報と正常性管理へのアクセスを民主化することで、organization全体でデータドリブン カルチャを促進する上で役立ちます。

主要なコンポーネント

  • データ モデル: ドメインとディメンションの詳細を含む 3NF モデル。
  • メタデータ: 次を含むデータ ガバナンス メタデータ:
    • ガバナンス ドメイン
    • データ製品
    • データ資産
    • 用語集の用語
    • サブスクリプション要求
    • データ品質ルール
    • Dimensions
    • データ品質の事実 (合格と失敗のカウント)
    • データ正常性アクション (データ品質アクションを含む)
    • さらに多くの

利点

  • エンパワーメント: データ実践者、データ製品所有者、データ スチュワード、アナリストがデータ ガバナンス メタデータを探索し、さまざまなソースからメタデータをリンクして分析情報を導き出す権限を与えます。
  • 柔軟性と効率性: 正常性管理では、すぐに使用できるレポートに加えて、カスタム レポートを作成できます。
  • 敏捷:organizationが正常性管理の問題と修復により迅速に対応できるようにします。
  • 費用 対 効果: プラットフォームとビルド ツールを設定する必要性を減らします。 すべてのデータは OneLake で使用でき、OneLake で使用可能なツール (ファブリック セマンティック モデル、Microsoft Power BI レポート、データ フロー、ノートブック) を使用できます。

現在使用可能なレポート (すぐに使用できる)

すぐに利用できるレポートを次に示します。 これらのレポートはカスタマイズできません。

セルフサービス分析メタデータのデータ モデル

3NF ドメイン モデルは、リレーショナル データベース設計の正規化プロセスの一部です。 これにより、データベースに冗長性が確保され、異常が更新されます。 データベース スキーマが 1 番目と 2 番目の標準フォームの要件を満たし、そのすべての属性が主キーにのみ機能的に依存している場合、データベース スキーマは 3 番目の標準フォームにあります。 3NF ドメイン モデルを使用して、重複を最小限に抑え、データの整合性を確保する方法でデータを構造化します。 ここでは、各情報が 1 回だけ格納される、より小さな関連テーブルにデータを分割することに重点を置いています。

特性:

  • 推移的な依存関係の削除: キー以外の属性は、他のキー以外の属性に依存しないでください。
  • 論理グループ化: データは、その機能または意味に基づいてドメインに論理的にグループ化されます。
  • Entity-Relationship ダイアグラム (ERD): エンティティの相互関係を示す 3NF ドメイン モデルを表すために一般的に使用されます。
テーブル名 テーブルに格納されている内容 リレーションシップ キー
アクセス ポリシーのプロビジョニング状態 プロビジョニングの状態に関する情報 ProvisioningStateId
アクセス ポリシー リソースの種類 ポリシー リソース情報にアクセスする ResourceTypeId
アクセス ポリシー セット アクセス ポリシー、ポリシーユース ケースの詳細、ポリシーが適用された場所に関する全体的な情報 AccessPolicySetId (UniqueId)、ResourceTypeId (FK)、ProvisioningStateId (FK)
ビジネス ドメイン* ビジネス ドメイン (統合カタログの "ガバナンス ドメイン" と呼ばれます) の名前、説明、状態、所有権の詳細 ユーザー ID (FK) によって作成された親ビジネス ドメイン ID (FK)、ユーザー ID によって最後に変更された (FK)
分類 データ資産分類情報 ClassificationId
重要なデータ列 このフィールドのデータ資産列に関連付けられている用語集の用語を格納する 重要なデータ列 ID、ビジネス ドメイン ID、資産 ID
重要なデータ要素 データ資産の重要なデータ要素 重要なデータ要素 ID
カスタム アクセスユース ケース ユース ケース情報にアクセスする AccessPolicySetId
データ資産 データ資産名、説明、ソース情報 DataAssetId (UniqueId)、DataAssetTypeId (FK)、CreatedByUserId (FK)、LastModifiedByUserId (FK)
データ資産列 データ資産列名、列の説明、および参照 DataAssetId (FK)、ColumnId (Unique)、DataAssetTypeId (FK)、DataTypeId (FK)、作成されたユーザー ID (FK)、最終変更ユーザー ID (FK)
データ資産列分類の割り当て データ分類の割り当てに関連する参照キー DataAssetId (FK)、ColumnId (FK)、ClassificationId (FK)
データ資産列の重要なデータ要素の割り当て 重要なデータ要素に関連付いているデータ資産列 ColumnId
データ資産ドメインの割り当て データ資産ガバナンス ドメインの割り当てに関する情報 DataAssetId (FK)、BusinessDomainId (FK)、AssignedByUserId (FK)
データ資産所有者 データ資産所有者情報 DataAssetOwnerId
データ資産所有者の割り当て データ資産所有者の割り当て情報 DataAssetId、DataAssetOwnerId
データ資産の種類 データ型 データ資産の種類の情報 DataTypeId (UniqueId)、DataAssetTypeId (FK)
Data Product データ製品名、説明、ユース ケース、状態、およびその他の関連情報 DataProductId (UniqueId)、DataProductTypeId (FK)、DataProductStatusId (FK)、UpdateFrequencyId (FK)、CreatedByUserId (FK)、LastUpdatedByUserId (FK)
データ製品資産の割り当て データ製品とデータ資産の割り当て情報 DataProductId、DataAssetId
Data Product Business Domain Assignment データ製品とガバナンス ドメインの割り当て情報 DataProductId (FK)、BusinessDomainId (FK)、AssignedByUserId (FK)
Data Product Critical データ要素の割り当て データ製品への重要なデータ要素の割り当て DataProductId
Data Product のドキュメント データ製品ドキュメントのリファレンス情報は、この表に格納されます。 DataProductId、DocumentationId
データ製品 OKR の割り当て データ製品に割り当てられた目標と主要な結果 データ製品 ID、目標 ID、キーの結果 ID
データ製品の所有者 データ製品所有者情報 DataProductId、DataProductOwnerId
データ製品の状態 データ製品の状態 (公開済みまたは下書きなど) 関連情報 DataProductStatusId
データ製品の使用条件 データ製品の使用条件情報 DataProductId、TermOfUsedId、DataAssetId
データ製品の種類 マスター、参照、運用など、データ製品の種類に関する情報 DataProductTypeId
データ製品の更新頻度 このデータ製品のデータが更新される頻度に関する情報 UpdateFrequencyId
データ品質資産ルールの実行 データ品質スキャンの結果 RuleId (FK)、DataAssetId (FK)、JobExecutionId (FK)
データ品質ジョブの実行 データ品質ジョブの実行状態 JobExecutionId (UniqueId)
データ品質ルール データ品質ルールに関する情報 RuleId (UniqueId)、RuleTypeId (FK)、BusinessDomainId (FK)、DataProductId (FK)、DataAssetId (FK)、JobTypeDisplayName (FK)、RuleOriginDisplayName (FK)、RuleTargetObjectType (FK)、CreatedByUserId (FK)、LastUpdatedByUserId (FK)
データ品質ルール列の実行 データ品質ルールの成功と失敗の数、列レベルのデータ品質スコア、およびデータ品質ジョブの実行の詳細に関する情報 RuleId (FK)、DataAssetId (FK)、ColumnId (FK)、JobExecutionId (FK)
データ品質規則の種類 データ品質ルールの種類と関連するディメンション RuleTypeId (UniqueId)、DimensionDisplayName (FK)
データ サブスクリプション要求 データ サブスクライバー、適用されたポリシー、サブスクリプション要求の状態、およびその他の関連情報に関する情報 SubscriberRequestId (UniqueId)、SubscriberIdentityTypeDisplayName (FK)、RequestorIdentityTypeDisplayName (FK)、RequestorStatusDisplayName (FK)
用語集の用語 用語集の用語、説明、用語集の用語の全体的な状態に関する情報 GlossaryTermId (UniqueId)、ParentGlossaryTermId (FK)、CreatedByUserId (FK)、LastModifiedByUserId (FK)
用語集用語ビジネス ドメインの割り当て 用語集の用語ガバナンス ドメインの割り当てと状態に関する情報 GlossaryTermId (FK)、BusinessDomainId (FK)、AssignedByUserId (FK)、GlossaryTermStatusId (FK)、CreatedByUserId (FK)、LastUpdatedByUserId (FK)
用語集用語クリティカル データ要素の割り当て 用語集の用語と重要なデータ要素の関連付け GlossaryTermId
用語集用語データ製品の割り当て 用語集用語データ製品の割り当てに関する情報 GlossaryTermId (FK)、DataProductId (FK)、AssignedByUserId (FK)、GlossaryTermStatusId (FK)、CreatedByUserId (FK)、LastUpdatedByUserId (FK)
正常性アクション データ ガバナンスとデータ品質アクションに関する情報 ActionId、TargetEntityId、CreatedByUserId
正常性アクション検索の種類 データ正常性アクション 型の検索 FindingTypeId
正常性アクションの検索サブタイプ データ正常性アクション サブ型の検索 FindingSubTypeId、FindingTypeId
正常性アクション ユーザーの割り当て データ正常性アクション ユーザー割り当て 情報 ActionId、AssignedToUserId
キーの結果 詳細な説明を含む、データ製品の目的の主な結果 キーの結果 ID、目標 ID
目標 データ製品の目的には、目的 ID、目的の説明、および目標の状態が含まれています 目標 ID
ポリシー セット承認者 ポリシー セットと承認者情報 SubscriberRequestId (FK)、AccessPolicySetId (FK)、ApproverUserId (FK)
リレーションシップ ソースの種類とターゲット情報に関する情報。 用語集の用語と資産と列の関連付けの関係については、このリレーションシップ テーブルを参照してください。 AccountId、SourceId、TargetId

* ビジネス ドメインは、新しい 統合カタログ ユーザー エクスペリエンスで "ガバナンス ドメイン" に名前が変更されましたが、データベースの物理モデルでは名前が変更されません。 名前の変更は、ビジネス ドメインに関してここで説明する使用シナリオには影響しません。

次の図は、前の表で説明したドメイン モデルのエンティティ関係を示しています。 ERD を参照するためのスクリーンショット。

統合カタログメタデータを Fabric OneLake にサブスクライブする

分析のために Microsoft Purview データ ガバナンス メタデータをサブスクライブし、次の手順に従って分析情報を取得します。

  1. Microsoft Purview ポータルで、[設定] を選択し、[統合カタログ] を選択し、[ソリューション統合 (プレビュー)] を選択します。

  2. データ ガバナンス管理者ロールがあることを確認します ( ロールとアクセス許可の詳細については、こちらをご覧ください)。

  3. [編集] を選択します。

  4. ストレージの種類を追加し、セットアップを有効にします

  5. 場所 URL の追加 (例: https://onelake.dfs.fabric.microsoft.com/workspace name/lakehouse name/Files/purviewmetadata)

  6. [ プロパティ] を選択して URL をコピーします。

    ファブリック URL 1 を構成する方法を示すスクリーンショット。

  7. [プロパティ] ページから URL をコピーします。

    ファブリック URL 2 を構成する方法を示すスクリーンショット。

  8. URL の末尾にフォルダー名を追加します。たとえば、前の図に示すように、 /DEH

  9. Microsoft Purview Manage Service Identity (MSI) への共同作成者アクセスを Fabric ワークスペースに付与します。

  10. 接続をテストします。

  11. [ 保存] を 選択して構成を保存し、Microsoft Purview メタデータを OneLake ワークスペースに発行します。

マネージド V-NET を有効にする

マネージド仮想ネットワークを有効または無効にするには、次の手順に従います。

  1. Microsoft Purview ポータルで、[ 設定] を選択します。
  2. [ソリューションの設定] で、[統合カタログ] を選択し、[ソリューション統合 (プレビュー)] を選択します。
  3. [ ストレージの構成 ] ポップアップ ウィンドウで、[ マネージド V-NET を有効にする ] トグルを選択して、ストレージのマネージド仮想ネットワークを有効にします。

vnet を構成する方法を示すスクリーンショット。

  1. [ターゲット リソース ID] を入力します。 たとえば、ターゲット リソース ID は /subscriptions/e2223ea4f73-6833-439d-b40e 615c78e2d8af/resourceGroups/vnettesting/providers/ です。 ストレージのリソース ID をコピーするには、ストレージの Json ビューを選択し、Json 文字列をコピーします。
  2. [ 更新/更新 MPE 状態 ] を選択して、更新プログラムを表示します。 状態が [プロビジョニング] から [保留中] に変わります。
  3. セットアップを完了するには、Microsoft Azure portalで MPE 要求を承認する必要があります。 要求を承認すると、MPE の状態が [保留中] から [承認済み] に変わります。

vNet プロビジョニング要求を承認する方法を示すスクリーンショット。

仮想ネットワークのセットアップを無効にするには、[ マネージド V-NET を有効にする] トグルを選択してオフの位置に切り替えます。 無効にした場合は、非仮想ネットワーク ストレージ エンドポイントを変更する必要があります。

構成済みの仮想ネットワークを削除する

マネージド仮想ネットワークのセットアップを削除するには、[記憶域の構成] ポップアップ ウィンドウで [MPE の削除] を選択します。 このアクションにより、仮想ネットワーク構成が削除され、[ストレージの 構成 ] ウィンドウから削除されます。 [ 接続のテスト ] 領域が再び表示され、仮想ネットワーク以外の接続をテストできます。 テスト接続は、仮想ストレージ以外のセットアップでのみ有効になります。

Fabric ストレージのマネージド仮想ネットワーク構成

Fabric テナントがVirtual NetworkまたはPrivate Linkで実行するように構成されている場合は、[ストレージの構成] ウィンドウで [マネージド V-NET を有効にする] を選択し、次に示すようにPrivate Linkリソース ID を追加する必要があります。/subscriptions/07d669d6-83f2-4f15-8b5b-4a4b31a3432/resourceGroups/pdgbugbashfabricvnet/providers/Microsoft.PowerBI/privateLinkServicesForPowerBI/fabricvnetpl.

仮想ネットワークのコンピューティングを設定するには、「マネージド仮想ネットワークの データ品質を設定する」を参照してください。 データ品質の仮想ネットワーク接続とコンピューティング割り当てを構成する前に、Fabric テナントのプライベート リンクを設定する必要があります。

仮想ネットワークのセットアップに関する役立つ情報

  • Microsoft Purview メタデータを格納するためにマネージド仮想ネットワークを有効にする場合は、仮想ネットワーク ストレージの場所 URL またはエンドポイントを使用していることを確認します。
  • 不適切なリソース グループを使用しないようにするには、JSN ビューを使用して、Azure portalから "ターゲット リソース ID" をコピーします。
  • 構成済みの仮想ネットワークを削除した場合は、エンドポイントまたは場所 URL を変更して、非仮想ネットワーク ストレージを使用し、非仮想ネットワーク ストレージの接続をテストしてください。

注:

データ品質エラー レコードを格納するには、ドメインごとに個別のフォルダーの場所を作成します。 この方法では、ドメイン固有のデータ品質エラー レコードを専用フォルダーに整理して格納します。

OneLake でセマンティック モデルを作成する

データと分析のコンテキストにおけるセマンティック モデルは、特定のドメイン内の意味、リレーションシップ、ルールを定義するデータの構造化表現を指します。 これは、特にビジネス インテリジェンス (BI) と分析プラットフォームのコンテキストで、複雑なデータをより直感的でアクセスしやすくすることで、ユーザーが複雑なデータを理解して操作するのに役立つ抽象化レイヤーを提供します。 セマンティック モデルは、レポートを構築する前に常に必要です。 ウェアハウス内では、ユーザーはウェアハウス オブジェクト (テーブルまたはビュー) を既定の Power BI セマンティック モデルに追加できます。 また、階層や説明など、他のセマンティック モデリング プロパティを追加することもできます。 これらのプロパティは、Power BI セマンティック モデルのテーブルを作成するために使用されます。 ユーザーは、既定の Power BI セマンティック モデルからオブジェクトを削除することもできます。

Microsoft Purview データ ガバナンス メタデータ ドメイン モデルからセマンティック モデルを作成するには:

  1. Fabric ワークスペースで Lakehouse を開きます。

  2. ショートカットを使用して、OneLake と OneLake 内からドメイン モデルのショートカットを作成します。

    1. [ テーブル ] 省略記号ボタン (...) を選択します。
    2. [ 新しいショートカット ] を選択し、[新しいショートカット ソース] ページから [Microsoft OneLake ] を選択します。
    3. ショートカットする DomainModel テーブルを選択します。

    ショートカットを使用して差分テーブルに発行する方法を示すスクリーンショット。

  3. すべてのファイルのショートカットをテーブル レベルで直接作成し、重複レコードを排除します。

    テーブル レベルのショートカットを作成する方法を示すスクリーンショット。

すべてのファイルをショートカットを使用してデルタ テーブルに発行した後、デルタ テーブルをセマンティック モデルに追加できます。

  1. [Lakehouse] ページから [SQL 分析エンドポイント] ページに切り替えます。
  2. [SQL 分析エンドポイント] ページの左上隅から [レポート] を選択します。
  3. [ 既定のセマンティック モデルの管理] を選択します。
  4. レポート用のセマンティック モデルに追加する dbo > テーブルからテーブルを選択します。

セマンティック モデルにテーブルを手動で追加する方法を示すスクリーンショット。

テーブルやビューなどのオブジェクトを既定の Power BI セマンティック モデルに追加するには、[ セマンティック モデルを自動的に更新する] を選択します。

セルフサービス分析セマンティック モデルを示すスクリーンショット。

注:

  • 右クリックして関連テーブルを追加してリレーションシップを作成できます。

  • セルフサービス分析のために Microsoft Purview メタデータをサブスクライブしない場合は、セルフサービス分析 (メタデータ サブスクリプション) を手動で無効にすることができます。[ソリューションの設定] > 統合カタログ > [ソリューション統合] > [セルフサービス分析] に移動し、トグルを選択して無効にすることができます。 この機能を有効または無効にするには、データ ガバナンス管理者ロールが必要です。

Purview カタログメタデータをData Lake Storage Gen2ストレージにサブスクライブする

次の手順に従って、分析と分析情報を得るために、Microsoft Purview のデータ ガバナンス メタデータをサブスクライブして AdlsG2 ストレージに発行して格納します。

  1. Microsoft Purview ポータルで、統合カタログを開きます。

  2. 左側のナビゲーションで [設定] を選択し、[ソリューションの設定] で [統合カタログ] を選択します。

  3. [ ソリューション統合] を選択し、[編集] を選択 します

  4. [ ストレージの種類 ] を選択し、[セットアップを 有効にする] を選択 します。

  5. 場所 URL を追加します。 この URL は、Data Lake Storage Gen2 パスにコンテナー名を加え、Data Lake Storage Gen2 + "/(コンテナー名)" として書式設定する必要があります。

    1. portal.azure.com に移動します。
      1. Data Lake Storage Gen2 ストレージ (ホーム > adlsg2) を選択します。
    2. [設定>Endpoints] に移動し、Microsoft Azure Data Lake ストレージのプライマリ エンドポイントを選択します。
  6. Data Lake Storage Gen2 コンテナーの Microsoft Purview Manage Service Identity (MSI) へのストレージ BLOB データ共同作成者アクセス権を付与します。

  7. 接続をテストします。

    モデルを参照する

  8. [保存] を選択して構成を保存し、ドメイン モデルを Data Lake Storage Gen2 ストレージに発行します。

注:

データ品質エラー レコードを格納するには、ドメインごとに個別のフォルダーの場所を作成します。 この方法では、ドメイン固有のデータ品質エラー レコードを専用フォルダーに整理して格納します。

公開されたモデルとデータを確認する

  1. portal.azure.com を開きます。

  2. Data Lake Storage Gen2 ストレージを選択します。

  3. Microsoft Purview でData Lake Storage Gen2 エンドポイントと共に追加したコンテナーを選択します。

  4. コンテナーに発行された Delta Parquet ファイルの一覧を参照します。

  5. 発行されたモデルとメタデータを参照します (次の画像を参照)。

    adlsg2 コンテナーでサブスクリプション接続を構成する方法を示すスクリーンショット。

    モデル ファイルを参照する

Power BI レポートを作成する

Power BI は、Fabric エクスペリエンス全体にネイティブに統合されています。 このネイティブ統合には、最もパフォーマンスの高いクエリとレポート エクスペリエンスを提供するために、Lakehouse からデータにアクセスするための DirectLake と呼ばれる一意のモードが含まれています。 DirectLake は、Power BI で大規模なセマンティック モデルを分析できる画期的な新機能です。 DirectLake を使用すると、データ ウェアハウスまたは Lakehouse エンドポイントにクエリを実行することなく、Power BI セマンティック モデルにデータをインポートまたは複製する必要なく、Parquet 形式のファイルをデータ レイクから直接読み込むことができます。 DirectLake は、データ レイクから直接 Power BI エンジンにデータを読み込むための高速パスであり、分析の準備ができています。

従来の DirectQuery モードでは、Power BI エンジンはクエリ実行ごとにソースからデータを直接クエリし、クエリのパフォーマンスはデータ取得速度に依存します。 DirectQuery を使用すると、データをコピーする必要がなくなり、ソース内の変更がクエリ結果にすぐに反映されます。

詳細については、 Microsoft Fabric で Power BI レポートを作成する方法に関するページを参照してください。

スケジュールを設定する

データ ガバナンス管理者は、次の手順に従って、セルフサービス分析メタデータの更新スケジュールを設定できます。

  1. Microsoft Purview ポータルで、統合カタログを開きます。
  2. 左側のナビゲーションで [設定] を選択し、[ソリューションの設定] で [統合カタログ] を選択します。
  3. [ ソリューション統合] を選択し、スケジューラ アイコンを選択します。
  4. [ セルフサービス分析のスケジュール] で、[ 有効] トグルをオンにし、開始日、頻度、終了日を設定します。
  5. [保存] を選択します。

ジョブ履歴

[ ジョブ履歴 ] を参照するには、セルフサービス分析ページにある [ジョブ履歴] アイコンをクリックします。 日付範囲に対してジョブの状態 [完了] または [失敗] をフィルター処理できます。

ジョブの状態の一覧を示すスクリーンショット。

重要

  • 既定の更新サイクルは 24 時間ごとです。
  • Microsoft Purview メタデータをサブスクライブして Fabric ワークスペースに発行する場合、Purview MSI には Fabric ワークスペースへの共同作成者アクセス権が必要です。
  • purview メタデータをサブスクライブして adlsg2 コンテナーに発行する場合、Purview MSI では、Azure Data Lake Storage Gen2へのストレージ BLOB データ共同作成者アクセス権が必要です。
  • データ更新ジョブのスケジュール設定はまだサポートされていません。
  • 仮想ネットワークはまだサポートされていません。
  • 管理資産データのみを公開しています。 データ製品に関連付けられているデータ資産は、管理資産として分類されます。 管理されていないデータ マップ資産は、セルフサービス分析データ資産テーブルには表示されません。
  • カタログには RBAC が実装されており、すべてのユーザーがすべてのドメインまたはデータ製品を表示できるわけではありません。 ただし、セルフサービス分析では、すべてのデータを公開し、このデータにアクセスできるすべてのユーザーがカタログ全体を表示できるようにします。 セルフサービス メタデータのアクセス制御は、データの格納場所によって異なります。ファブリック ワークスペース所有者または ADLS Gen2 ストレージ所有者がアクセスを管理できます。
  • セルフサービス分析のために Microsoft Purview メタデータをサブスクライブしない場合は、セルフサービス分析 (メタデータ サブスクリプション) を手動で無効にすることができます。[ソリューションの設定] > 統合カタログ > [ソリューション統合] > [セルフサービス分析] に移動し、トグルを選択して無効にすることができます。 この機能を有効または無効にするには、データ ガバナンス管理者ロールが必要です。