Freigeben über


Problembehandlung bei der Datenqualität

In diesem Artikel werden häufig gestellte Fragen und Fehlersymptome sowie mögliche Lösungen beschrieben:

Warum wird beim Scanauftrag ein Fehler mit einer ungültigen Quelle angezeigt?

  • Dieser Fehler kann aus zwei Gründen angezeigt werden:
    • Die Deltatabelle ist am Speicherort nicht vorhanden.
    • Die Daten in der Datei weisen kein gültiges Deltaformat auf.

Ich stelle Datenqualitätsüberprüfungen für meine Microsoft Fabric-Deltatabellen ein. Ich sehe alle Datenassets in der Datenqualitätsansicht, wähle ein Medienobjekt aus und wende Regeln für die Datenqualitätsüberprüfung an, aber die Überprüfung schlägt fehl.

  • Ihre Datenqualitätsüberprüfung kann aus verschiedenen Gründen fehlschlagen:

Warum wird die Fehlermeldung "Keine Verbindung kann verwendet werden. Versuchen Sie zuerst, eine Verbindung herzustellen."?

  • Zum Erstellen eines Profils für Daten oder zum Ausführen der Datenqualitätsüberprüfung müssen Sie zunächst eine Datenquellenverbindung konfigurieren. Diese Warnung wird nicht mehr angezeigt, nachdem Sie eine Datenquellenverbindung erstellt haben.

Warum ist die Gesamtanzahl der Profilerstellungsdaten kleiner als die Gesamtanzahl in meiner Microsoft Azure Data Lake Storage Gen2 Delta-Tabelle?

  • Microsoft Purview Data Quality verwendet eine Stichprobengröße von 1 Million für die Profilerstellung. Diese Stichprobe wird nach dem Zufallsprinzip entnommen. Wenn Ihre Deltatabelle mehr als 1 Million Datensätze enthält, stimmt die Gesamtanzahl nicht überein.

Warum wird eine Aktion zur fehlenden Datenqualitätsbewertung für ein Datenprodukt angezeigt, aber die Bewertung wird im Datenprodukt angezeigt, wenn ich die Datenproduktansicht durchsucht habe?

  • Als die Aktion erstellt wurde, gab es keine Datenqualitätsbewertung für dieses Datenprodukt. Die Datenqualitätsüberprüfung wurde ausgeführt, nachdem die Aktion erstellt und die Bewertung für das Datenprodukt veröffentlicht wurde. Schließen Sie die Aktion, nachdem die Wiederherstellung abgeschlossen ist, um Verwirrung zu vermeiden.

Beim Erstellen von Datenqualitätsregeln aus "Vorschlagsregeln" wird beim Versuch, alle 30 vorgeschlagenen Regeln hinzuzufügen, ein Fehler in Bezug auf eine Datumsspalte ausgelöst.

  • Dieser Fehler tritt auf, weil der Schemadatentyp in der Datenqualitätsschemasicht nicht unterstützt wird . Sie können den Datentyp in "Date " ändern, indem Sie die Umschaltfläche für die Schemaverwaltung auswählen und ihn speichern. Nachdem Sie den Datentyp geändert haben, sollten Sie die Regel hinzufügen können.

Warum wird beim Versuch, alle vorgeschlagenen Regeln hinzuzufügen, der Fehler "ObserverId ist bereits vorhanden" angezeigt?

  • Höchstwahrscheinlich wurde die gleiche oder identische Regel bereits zu einer Spalte hinzugefügt. Wenn Sie versuchen, einer Spalte die gleiche oder identische Regel hinzuzufügen, löst die Anwendung diese Fehlermeldung aus.

Warum wird mein geplanter Auftrag übersprungen, anstatt ausgeführt zu werden? Für Aufträge zur Datenqualitätsüberprüfung wird übersprungen angezeigt.

  • Der Data Quality-Auftrag überprüft und führt die Datenqualität nur dann aus, wenn seit der letzten Ausführung Änderungen vorgenommen wurden. Der Deltaverlauf wird überprüft. Übersprungen bedeutet, dass seit der letzten Ausführung keine Änderungen an den Daten vorgenommen wurden und die Spark-Ausführung für die Datenqualität nicht ausgeführt wird. Übersprungen bedeutet nicht, dass ein Fehler aufgetreten ist.

Wenn ich die Registerkarte "Profildaten" auswähl, wird die Anzahl der spaltenvorgewählt. Kann ich die ausgewählten Spalten ändern?

  • Microsoft Purview Data Quality verwendet eine KI-gestützte Profilerstellungslösung. Die Microsoft Purview-Datenprofilerstellungs-KI wählt die vorab ausgewählten Spalten aus. Sie können die Auswahl dieser Spalten aufheben und basierend auf der Wichtigkeit der Spalten erneut auswählen und speichern und ausführen auswählen, um die Profilerstellung auszuführen.

Warum kann ich einige der Datenressourcen nicht auf der Seite der Datenqualitätsressourcenliste auswählen, um ein Profil zu erstellen und zu überprüfen?

  • Es kann einige Gründe geben:
    • Diese Datenassets werden aus nicht unterstützten Datenquellen veröffentlicht.
    • Das Dateiformat dieser Datenassets wird nicht unterstützt.

Warum schlägt mein Profilerstellungsauftrag für die unterstützten Datenquellen fehl?

  • Überprüfen Sie das Schema, um sicherzustellen, dass kein Spaltenname mit Leerzeichen vorhanden ist. Die aktuelle Version unterstützt keine Spaltennamen mit Leerzeichen.

Warum kann ich keine Datenqualitätsüberprüfung und Datenprofilerstellung für CSV-, TSV- und Textdateien ausführen?

  • Data Quality unterstützt derzeit das Delta-Format von Parquet, Delta, Iceberg ORC und Iceberg AVRO. Purview Data Quality unterstützt keine CSV-, TSV- und Textdateien.

Warum wird die Aktualitätsregel für die Datenqualität in der Regelliste nicht angezeigt?

  • Microsoft Azure SQL Tabellen unterstützen die Aktualität der Datenqualität nicht. Wenn es sich bei Ihrer Datenressource um eine Azure SQL Tabelle handelt, wird die Aktualitätsregel nicht in der Liste für die Auswahl und Anwendung auf die Datenressource angezeigt.

Warum wird der Datentyp Undefined für einige Spalten eines Datenassetschemas auf einer Datenqualitätsschemaseite angezeigt?

  • Es scheint, dass der Datentyp für alle Spalten nicht ordnungsgemäß identifiziert wurde. Sie können das Schema importieren, um das Problem zu beheben (um den Datentyp zu aktualisieren). Wählen Sie auf der Übersichtsseite der Datendalität das Menüelement Schema aus, wählen Sie die Umschaltfläche Schemaverwaltung und dann Schema importieren aus. Wählen Sie nach dem Importieren des Schemas erneut die Umschaltfläche für die Schemaverwaltung aus, um das aktualisierte Schema zu speichern.

  • Microsoft Azure SQL Tabellen unterstützen die Aktualität der Datenqualität nicht. Wenn es sich bei Ihrer Datenressource um eine Azure SQL Tabelle handelt, wird die Aktualitätsregel nicht in der Liste für die Auswahl und Anwendung auf die Datenressource angezeigt.

Bei meinem Auftrag zur Überprüfung der Datenqualität ist ein Fehler aufgetreten. Die Fehlermeldung "Interner Dienstfehler ist aufgetreten, wiederholen Sie den Vorgang, oder wenden Sie sich an den Microsoft-Support.". Wie kann ich die Problembehandlung durchführen?

  • Viele Gründe können dazu führen, dass die Überprüfung mit der folgenden Fehlermeldung fehlschlägt:
    • Der Benutzer ist nicht berechtigt, den aktuellen Vorgang für den Arbeitsbereich auszuführen, auf den der Benutzer für die Datenqualitätsüberprüfung zugreifen möchte.
    • Fehlercode 403, d. h. der Zugriff auf Datenquellen ist vorübergehend verboten.
    • Der gewährte Zugriff auf die Datenquelle für Ihre verwaltete Identität (MANAGED Identity, MSI) ist abgelaufen.
    • Microsoft Purview Managed Identity (MSI) benötigt Mitwirkender Zugriff auf den Microsoft Fabric-Arbeitsbereich. Wenn der Mitwirkender Zugriff für die Microsoft Purview MSI nicht für den Microsoft Fabric-Arbeitsbereich bereitgestellt wurde, schlägt die Überprüfung der Datenqualität fehl.

Warum erhalte ich einen Deltaformatfehler, obwohl ich das Delta-Format verwende?

  • Wir unterstützen Spark 3.4 Delta 2.4. Stellen Sie sicher, dass Sie Delta Lake Version 2.4 verwenden.

Warum wird der Fehler angezeigt, wenn ich eine Verweisdatenressource ausgewählt habe, um die Tabellensuchregel zu konfigurieren?

  • Sie haben eine Datenressource ausgewählt, die nicht teilgebunden ist oder auf ein Datenprodukt in derselben Governancedomäne verweist. So wählen Sie die richtige Datenressource aus:
    • Wählen Sie verweistabelle auswählen aus, wie in dieser Abbildung dargestellt:

      Screenshot: Fehler beim Suchen von Datenassetobjekten

    • Abbrechen der aktuellen Auswahl, wie in dieser Abbildung dargestellt:

      Screenshot der Auswahl der richtigen Datenressource.

    • Nachdem Sie die aktuelle Auswahl abgebrochen haben, wählen Sie ein anderes Medienobjekt aus.

Wie kann ich den Zugriff auf die Datenquelle für Microsoft Purview MSI konfigurieren?

Alle Datenquellen befinden sich hinter dem privaten Endpunkt (im virtuellen Netzwerk). Kann Microsoft Purview für die Datenqualitätsüberprüfung auf Daten im virtuellen Netzwerk zugreifen?

Wo finde ich Dokumentation zur Ausdrucksfunktion zum Erstellen benutzerdefinierter Regeln?

Warum schlägt meine Datenqualitätsüberprüfung für die Fabric Lakehouse-Tabelle fehl?

  • Der Fehler kann aus vielen Gründen verursacht werden:
    • Stellen Sie sicher, dass Ihre Lakehouse-Tabellen in Data Map mit Schema auffindbar sind.

    • Stellen Sie sicher, dass Sie den SPN für die Data Map-Überprüfung und MSI für die Datenqualitätsüberprüfung verwenden.

    • Stellen Sie sicher, dass Sie die DQ-Verbindung mit MSI konfiguriert haben.

      • Stellen Sie sicher, dass Microsoft Purview MSI Mitwirkender Zugriff auf Ihren Fabric-Arbeitsbereich hat.
      • Microsoft OneLake-Einstellung aktivieren: Benutzer können mit Apps außerhalb von Fabric auf in OneLake gespeicherte Daten zugreifen.

      Screenshot: onelake-Einstellung

    • Erfahren Sie, wie Sie die Datenqualität für Fabric Lakehouse konfigurieren.

    • Erfahren Sie, wie Sie ein Data Map-Scan-Setup für Fabric konfigurieren.

Warum können Benutzer kein verwaltetes virtuelles Netzwerk (VNET) für die Konfiguration der Datenqualität in Microsoft Purview für Databricks, Synapse oder anderen unterstützten Datenquellen aktivieren?

  • Problem: Nach dem Aktivieren des Kontrollkästchens Verwaltetes VNET aktivieren und die Genehmigung erhalten hat, treten keine Änderungen auf der Microsoft Purview-Seite auf, und nachfolgende Versuche, eine Verbindung zu erstellen, schlagen fehl, ohne dass eine Anforderung zur Genehmigung an die Quellen gesendet wird (z. B. Azure Databricks, Synpase, Azure Data Lake Storage Gen2).

  • Lösung: Dieses Problem tritt auf, wenn ein Benutzer den verwalteten privaten Endpunkt (Managed Private Endpoint, MPE) nach der Konfiguration löscht. Wenn ein Benutzer die MPE nach der ersten Genehmigung direkt aus der Quelle aktualisiert oder löscht, kann das Data Quality-System die MPE-status Änderung derzeit nicht nachverfolgen. Wenden Sie sich an den Microsoft-Support, um dieses Problem zu beheben.