次の方法で共有


データ品質のトラブルシューティング

この記事では、一般的な質問とエラーの症状と、考えられる解決策について説明します。

スキャン ジョブから無効なソース エラーが表示されるのはなぜですか?

  • このエラーは、次の 2 つの理由で発生する可能性があります。
    • デルタ テーブルが場所に存在しません。
    • ファイル内のデータが有効なデルタ形式ではありません。

Microsoft Fabric デルタ テーブルのデータ品質スキャンを設定しています。 データ品質ビューにすべてのデータ資産が表示され、1 つの資産を選択し、データ品質スキャンのルールを適用しますが、スキャンは失敗します。

  • データ品質スキャンは、いくつかの理由で失敗する可能性があります。

"接続を使用できません" というエラー メッセージが表示される理由 最初に接続を作成してみてください。??

  • データをプロファイリングしたり、データ品質スキャンを実行したりするには、まずデータ ソース接続を構成する必要があります。 このアラートは、 データ ソース接続を作成した後に消えます。

プロファイルされたデータの合計数が Microsoft Azure Data Lake Storage Gen2 差分テーブルの合計数より少ないのはなぜですか?

  • Microsoft Purview データ品質では、プロファイリングに 100 万のサンプル サイズが使用されます。 このサンプルは ランダムに取得されます。 デルタ テーブルに 100 万を超えるレコードがある場合、合計カウントは一致しません。

データ製品のデータ品質スコアが見つからない場合にアクションが表示されるのに、データ製品ビューを参照したときにデータ製品にスコアが表示されるのはなぜですか?

  • アクションが作成されたとき、そのデータ製品のデータ品質スコアはありませんでした。 データ品質スキャンは、アクションが作成され、データ製品のスコアが公開された後に実行されました。 混乱を避けるために修復が完了したら、アクションを閉じます。

"ルールの提案" からデータ品質ルールを作成すると、提案された 30 個のルールをすべて追加しようとすると、"日付" 列に関するエラーがスローされます

  • このエラーは、スキーマ データ型がデータ品質スキーマ ビューで サポートされていないため に発生します。 データ型日付に変更するには、スキーマ管理トグルを選択して保存します。 データ型を変更すると、ルールを追加できるようになります。

推奨されるすべてのルールを追加しようとすると、"ObserverId が既に存在する" というエラーが表示されるのはなぜですか?

  • ほとんどの場合、同じルールまたは同じルールが列に既に追加されています。 同じルールまたは同じルールを列に追加しようとすると、アプリケーションはこのエラー メッセージをスローします。

スケジュールされたジョブが実行されるのではなくスキップされるのはなぜですか? データ品質スキャン ジョブの スキップに 関するページが表示されます。

  • データ品質ジョブは、前回の実行以降に変更がある場合にのみ、データ品質をチェックして実行します。 デルタ履歴を確認します。 スキップは、前回の実行以降にデータに変更がないことを意味し、データ品質の Spark 実行は実行されません。 スキップしても失敗したわけではありません。

[プロファイル データ] タブを選択すると、事前に選択された列の数が表示されます。 選択した列を変更できますか?

  • Microsoft Purview データ品質は、AI 支援プロファイリング ソリューションを使用します。 Microsoft Purview データ プロファイル AI は、事前に選択された列を選択します。 これらの列の選択を解除し、列の重要度に基づいて再選択し、[ 保存して実行] を選択してプロファイルを実行できます。

データ品質資産リスト ページからプロファイルとスキャンにデータ資産の一部を選択できないのはなぜですか?

  • いくつかの理由があります。
    • これらのデータ資産は、サポートされていないデータ ソースから発行されます。
    • これらのデータ資産のファイル形式はサポートされていません。

サポートされているデータ ソースに対してプロファイル ジョブが失敗するのはなぜですか?

  • スキーマを確認して、スペースを含む列名がないことを確認します。 現在のバージョンでは、スペースを含む列名はサポートされていません。

CSV、TSV、テキスト ファイルのデータ品質スキャンとデータ プロファイルを実行できないのはなぜですか?

  • データ品質は現在、Parquet、Delta、Iceberg ORC、Iceberg AVRO の Delta 形式をサポートしています。 Purview データ品質では、CSV、TSV、テキスト ファイルはサポートされていません。

ルールの一覧にデータ品質の鮮度ルールが表示されないのはなぜですか?

  • Microsoft Azure SQL テーブルでは、データ品質の鮮度はサポートされていません。 データ資産がAzure SQLテーブルの場合、選択とデータ資産への適用の一覧に鮮度ルールは表示されません。

データ品質スキーマ ページのデータ資産スキーマの一部の列に対してデータ型が Undefined と表示されるのはなぜですか?

  • すべての列のデータ型が正しく識別されていないようです。 スキーマをインポートして問題を解決できます (データ型を更新するため)。 データデュアルティの概要ページからスキーマ メニュー項目を選択し、[ スキーマ管理 ] トグルを選択して、[ スキーマのインポート] を選択します。 スキーマをインポートした後、スキーマ管理トグルをもう一度選択して、更新されたスキーマを保存します。

  • Microsoft Azure SQL テーブルでは、データ品質の鮮度はサポートされていません。 データ資産がAzure SQLテーブルの場合、選択とデータ資産への適用の一覧に鮮度ルールは表示されません。

データ品質スキャン ジョブが失敗しました。 "内部サービス エラーが発生しました、再試行してください、または Microsoft サポートにお問い合わせください" というエラー メッセージが表示されます。 トラブルシューティングを行うにはどうすればよいですか?

  • 多くの理由により、このエラー メッセージでスキャンが失敗する可能性があります。
    • ユーザーがデータ品質スキャンにアクセスしようとしているワークスペースに対して現在の操作を実行する権限がありません。
    • エラー コード 403。つまり、データ ソースへのアクセスは一時的に禁止されています。
    • マネージド ID (MSI) のデータ ソースへのアクセス権が付与され、有効期限が切れています。
    • Microsoft Purview マネージド ID (MSI) には、Microsoft Fabric ワークスペースへの共同作成者アクセス権が必要です。 Microsoft Purview MSI の共同作成者アクセスが Microsoft Fabric ワークスペースに提供されていない場合、データ品質スキャンは失敗します。

デルタ形式を使用しているにもかかわらず、デルタ形式エラーが発生する理由

  • Spark 3.4 Delta 2.4 をサポートしています。 Delta Lake バージョン 2.4 を使用していることを確認します。

テーブル参照ルールを構成するために参照データ資産を選択したときにエラーが表示されるのはなぜですか?

  • 同じガバナンス ドメインのデータ製品にリンクまたは参照されていないデータ資産を選択しました。 適切なデータ資産を選択するには:
    • 次の図に示すように、[ 参照テーブルの選択] を選択します。

      参照データ資産エラーのスクリーンショット。

    • 次の図に示すように、現在の選択を取り消します。

      正しいデータ資産を選択しているスクリーンショット。

    • 現在の選択を取り消した後、別のアセットを選択します。

Microsoft Purview MSI のデータ ソースへのアクセスを構成するにはどうすればよいですか?

  • MSI 構成ガイドを次に示します。詳細については、このドキュメントを参照してください。

すべてのデータ ソースがプライベート エンドポイント (仮想ネットワーク内) の背後にあります。Microsoft Purview は、データ品質スキャンのために仮想ネットワーク内のデータにアクセスできますか?

カスタム ルールを作成するための式関数に関するドキュメントはどこで見つけることができますか?

Fabric Lakehouse テーブルのデータ品質スキャンが失敗するのはなぜですか?

  • 多くの理由でエラーが発生する可能性があります。
    • スキーマを使用した Data Map でレイクハウス テーブルを検出できることを確認します。

    • データ マップ スキャンに SPN を使用し、データ品質スキャンに MSI を使用していることを確認します。

    • MSI との DQ 接続が構成されていることを確認します。

      • Microsoft Purview MSI が Fabric ワークスペースへの共同作成者アクセス権を持っていることを確認します。
      • Microsoft OneLake 設定を有効にする: ユーザーは、OneLake に格納されているデータに Fabric 外部のアプリでアクセスできます。

      onelake 設定のスクリーンショット。

    • Fabric Lakehouse のデータ品質を構成する方法について説明します。

    • Fabric のデータ マップ スキャンセットアップを構成する方法について説明します。

Microsoft Purview for Databricks または Synapse、またはその他のサポートされているデータ ソースで、ユーザーがデータ品質構成のマネージド仮想ネットワーク (VNET) を有効にできないのはなぜですか?

  • 問題: [マネージド Vnet を有効にする] チェック ボックスをオンにして承認を受けた後、Microsoft Purview 側で変更が行われず、その後、接続の作成が失敗し、承認のためにソースに送信された要求 (Azure Databricks、Synpase、Azure Data Lake Storage Gen2 など) がありません。

  • 解決策: この問題は、ユーザーがマネージド プライベート エンドポイント (MPE) を構成した後に削除したときに発生します。 現時点では、ユーザーが最初の承認後にソースから直接 MPE を更新または削除した場合、データ品質システムは MPE の状態の変更を追跡できません。 この問題を解決するには、Microsoft サポートにお問い合わせください。