Untersuchen und Überprüfen von Beziehungen in semantischen Modellen und DataFrames

In diesem Artikel erfahren Sie, wie Sie SemPy-Funktionen für semantische Verknüpfungen verwenden, um Beziehungen in Power BI-Semantikmodellen und Pandas DataFrames zu ermitteln und zu überprüfen.

In Data Science und maschinellem Lernen ist es wichtig, die Struktur und Beziehungen in Ihren Daten zu verstehen. Mit Power BI können Sie diese Strukturen und Beziehungen modellieren und visualisieren. Verwenden Sie semantische Linkfunktionen in SemPy-Bibliotheksmodulen, um mehr Einblicke zu erhalten oder Machine Learning-Modelle zu erstellen.

Data Scientists und Business Analysts verwenden SemPy-Funktionen zum Auflisten, Visualisieren und Überprüfen von Beziehungen in Power BI-Semantikmodellen oder zum Suchen und Überprüfen von Beziehungen in Pandas DataFrames.

Voraussetzungen

Erwerben Sie ein Microsoft Fabric-Abonnement. Registrieren Sie sich alternativ für eine kostenlose Microsoft Fabric-Testversion.
Melden Sie sich bei Microsoft Fabric an.
Wechseln Sie zu Fabric, indem Sie den Benutzeroberflächenschalter auf der unteren linken Seite Ihrer Startseite verwenden.

Erstellen Sie ein neues Notizbuch , um Code in Zellen zu kopieren und einzufügen.
Für Spark 3.4 und höher ist der semantische Link in der Standardlaufzeit verfügbar, wenn Sie Fabric verwenden, sodass Sie ihn nicht installieren müssen. Führe für Spark 3.3 oder niedriger oder zum Aktualisieren auf die neueste Version von Semantic Link den folgenden Befehl aus:
```
%pip install -U semantic-link
```
Hinzufügen eines Seehauses zu Ihrem Notizbuch

Listenbeziehungen in semantischen Modellen

Die list_relationships-Funktion im sempy.fabric-Modul gibt eine Liste aller Beziehungen zurück, die in einem Power BI-Semantikmodell enthalten sind. Die Liste hilft Ihnen, die Struktur Ihrer Daten und die Verbindung zwischen verschiedenen Tabellen und Spalten zu verstehen.

Diese Funktion funktioniert mithilfe der semantischen Verknüpfung, um kommentierte DataFrames bereitzustellen. Die DataFrames enthalten die notwendigen Metadaten, um die Beziehungen innerhalb des semantischen Modells zu verstehen. Die annotierten DataFrames machen es einfach, die Struktur des semantischen Modells zu analysieren und es in Modellen für maschinelles Lernen oder anderen Datenanalyseaufgaben zu verwenden.

Um die list_relationships-Funktion zu verwenden, müssen Sie zuerst das sempy.fabric-Modul importieren. Dann rufen Sie die Funktion unter Verwendung des Namens oder der UUID Ihres semantischen Power BI-Modells auf, wie im folgenden Beispiel gezeigt:

import sempy.fabric as fabric

fabric.list_relationships("my_dataset")

Der vorangehende Code ruft die list_relationships Funktion mit einem Power BI-Semantikmodell namens my_dataset auf. Die Funktion gibt einen Pandas DataFrame mit einer Zeile für jede Beziehung zurück, sodass Sie Beziehungen im semantischen Modell schnell untersuchen und analysieren können.

Hinweis

Ihr Notebook, Ihr semantisches Power BI-Dataset-Modell und Ihr Lakehouse können sich im selben Arbeitsbereich oder in verschiedenen Arbeitsbereichen befinden. SemPy versucht standardmäßig, an folgenden Stellen auf Ihr semantisches Modell zuzugreifen:

Im Arbeitsbereich Ihres Lakehouse, wenn Sie ein Lakehouse an Ihr Notebook angefügt haben.
Im Arbeitsbereich Ihres Notebooks, wenn kein Lakehouse angefügt ist.

Wenn sich Ihr semantisches Modell nicht in einem dieser Arbeitsbereiche befindet, müssen Sie den Arbeitsbereich Ihres semantischen Modells angeben, wenn Sie eine SemPy-Methode aufrufen.

Beziehungen in semantischen Modellen visualisieren

Verwenden Sie die plot_relationship_metadata Funktion, um Beziehungen in einem semantischen Modell zu visualisieren und zu erfahren, wie das Modell strukturiert ist. Diese Funktion erstellt ein Diagramm, das Verbindungen zwischen Tabellen und Spalten anzeigt, wodurch einfacher zu erkennen ist, wie verschiedene Elemente miteinander verknüpft sind.

Hier ist ein Beispiel für die Verwendung der plot_relationship_metadata Funktion:

import sempy.fabric as fabric
from sempy.relationships import plot_relationship_metadata

relationships = fabric.list_relationships("my_dataset")
plot_relationship_metadata(relationships)

Im Beispiel ruft die list_relationships Funktion die Beziehungen im my_dataset semantischen Modell ab, und die plot_relationship_metadata Funktion erstellt ein Diagramm, um diese Beziehungen anzuzeigen.

Passen Sie das Diagramm an, indem Sie auswählen, welche Spalten einbezogen werden sollen, festlegen, wie fehlende Schlüssel behandelt werden sollen, und weitere Graphviz-Attribute hinzufügen.

Beziehungen in semantischen Modellen validieren

Verwenden Sie die list_relationship_violations Funktion, um Beziehungen in Ihrem semantischen Modell zu überprüfen und Probleme oder Inkonsistenzen zu finden. Die list_relationship_violations Funktion überprüft Ihre Tabellen, um sicherzustellen, dass sie den Beziehungen in Ihrem semantischen Modell entsprechen.

Diese Funktion hilft Ihnen dabei, Inkonsistenzen mit Beziehungsmehrheit zu finden und Probleme zu beheben, bevor sie sich auf Ihre Datenanalyse oder Machine Learning-Modelle auswirken.

Um die list_relationship_violations Funktion zu verwenden, importieren Sie das sempy.fabric Modul, und lesen Sie die Tabellen aus Dem semantischen Modell. Rufen Sie dann die Funktion mit einem Wörterbuch auf, das Tabellennamen datenframes mit Tabelleninhalt zuordnet.

Der folgende Beispielcode zeigt, wie Beziehungsverstöße aufgelistet werden:

import sempy.fabric as fabric

tables = {
    "Sales": fabric.read_table("my_dataset", "Sales"),
    "Products": fabric.read_table("my_dataset", "Products"),
    "Customers": fabric.read_table("my_dataset", "Customers"),
}

fabric.list_relationship_violations(tables)

Der vorangehende Code ruft die list_relationship_violations Funktion mit einem Wörterbuch mit den Tabellen "Vertrieb", " Produkte" und " Kunden " aus dem semantischen Modell my_dataset auf. Sie können die Funktion anpassen, indem Sie einen Abdeckungsschwellenwert festlegen, auswählen, wie fehlende Schlüssel behandelt werden sollen, und die Anzahl der zu meldenden fehlenden Schlüssel festlegen.

Die Funktion gibt einen Pandas DataFrame mit einer Zeile für jede Beziehungsverletzung zurück, sodass Sie Probleme in Ihrem semantischen Modell schnell finden und beheben können. Verwenden Sie die list_relationship_violations Funktion, um Ihr semantisches Modell konsistent und präzise zu halten, sodass Sie zuverlässigere Machine Learning-Modelle erstellen und bessere Einblicke aus Ihren Daten erhalten.

Suchen von Beziehungen in Pandas DataFrames

Die Funktionen list_relationships, plot_relationships_df und list_relationship_violations im Fabric-Modul sind leistungsstarke Werkzeuge zum Erforschen von Beziehungen in semantischen Modellen. Manchmal müssen Sie Beziehungen in anderen Datenquellen finden, z. B. Pandas DataFrames.

Verwenden Sie die find_relationships Funktion im sempy.relationship Modul, um Beziehungen in Pandas DataFrames zu finden.

Mit der Funktion find_relationships im Modul sempy.relationships können Datenwissenschaftler und Geschäftsanalysten potenzielle Zusammenhänge in einer Liste von Pandas DataFrames finden. Diese Funktion hilft Ihnen, Verbindungen zwischen Tabellen und Spalten zu erkennen, sodass Sie mehr über Ihre Daten und die Beziehung der zugehörigen Elemente erfahren.

Hier erfahren Sie, wie Sie Beziehungen in Pandas DataFrames finden:

from sempy.relationships import find_relationships

tables = [df_sales, df_products, df_customers]

find_relationships(tables)

Der vorangehende Code ruft die find_relationships Funktion mit einer Liste von drei Pandas DataFrames auf: df_sales, , df_productsund df_customers. Die Funktion gibt einen Pandas DataFrame mit einer Zeile für jede potenzielle Beziehung zurück, sodass Sie Beziehungen in Ihren Daten untersuchen und analysieren können.

Passen Sie die Funktion an, indem Sie einen Deckungsschwellenwert festlegen, einen Schwellenwert für die Namensähnlichkeit, eine Liste der auszuschließenden Beziehungen und entscheiden Sie, ob viele-zu-viele Beziehungen eingeschlossen werden sollen.

Überprüfen von Beziehungen in Pandas DataFrames

Nachdem Sie potenzielle Beziehungen in Ihren Pandas DataFrames mithilfe der find_relationships Funktion gefunden haben, verwenden Sie die list_relationship_violations Funktion, um diese Beziehungen zu überprüfen und Probleme oder Inkonsistenzen zu identifizieren.

Die list_relationship_violations Funktion überprüft Ihre Tabellen, um sicherzustellen, dass sie den ermittelten Beziehungen entsprechen. Verwenden Sie diese Funktion, um Inkonsistenzen mit der angegebenen Beziehungsmehrheit zu finden, damit Sie Probleme beheben können, bevor sie sich auf Ihre Datenanalyse oder Machine Learning-Modelle auswirken.

Hier ist ein Beispiel, das zeigt, wie Sie Beziehungsverstöße in Pandas DataFrames finden:

from sempy.relationships import find_relationships, list_relationship_violations

tables = [df_sales, df_products, df_customers]
relationships = find_relationships(tables)

list_relationship_violations(tables, relationships)

Im Beispiel wird die list_relationship_violations-Funktion mit drei pandas-DataFrames aufgerufen: df_sales, df_products und df_customers, zusammen mit dem Beziehungs-DataFrame aus der find_relationships-Funktion. Die list_relationship_violations Funktion gibt einen Pandas DataFrame mit einer Zeile für jede Beziehungsverletzung zurück, sodass Sie probleme in Ihren Daten schnell finden und beheben können.

Passen Sie die Funktion an, indem Sie einen Abdeckungsschwellenwert festlegen, auswählen, wie fehlende Schlüssel behandelt werden sollen, und definieren Sie, wie viele fehlende Schlüssel erfasst werden sollen.

Verwenden Sie die list_relationship_violations Funktion mit Pandas DataFrames, um Ihre Daten konsistent und genau zu halten. Auf diese Weise können Sie zuverlässige Machine Learning-Modelle erstellen und tiefere Einblicke aus Ihren Daten gewinnen.

Feedback

War diese Seite hilfreich?

Last updated on 2025-09-29