Freigeben über


Berechnete Tabellenszenarien und Anwendungsfälle

Es gibt Vorteile bei der Verwendung berechneter Tabellen in einem Datenfluss. In diesem Artikel werden Anwendungsfälle für berechnete Tabellen beschrieben und beschrieben, wie sie hinter den Kulissen funktionieren.

Was ist eine berechnete Tabelle?

Eine Tabelle stellt die Datenausgabe einer Abfrage dar, die in einem Datenfluss erstellt wurde, nachdem der Datenfluss aktualisiert wurde. Sie stellt Daten aus einer Quelle und optional die Transformationen dar, die darauf angewendet wurden. Manchmal möchten Sie möglicherweise neue Tabellen erstellen, die eine Funktion einer zuvor aufgenommenen Tabelle sind.

Obwohl es möglich ist, die Abfragen, die eine Tabelle erstellt haben, zu wiederholen und neue Transformationen darauf anzuwenden, hat dieser Ansatz Nachteile: Daten werden zweimal aufgenommen, und die Auslastung der Datenquelle wird verdoppelt.

Berechnete Tabellen lösen beide Probleme. Berechnete Tabellen ähneln anderen Tabellen, in denen sie Daten aus einer Quelle abrufen, und Sie können weitere Transformationen anwenden, um sie zu erstellen. Ihre Daten stammen jedoch aus dem verwendeten Speicherdatenfluss und nicht aus der ursprünglichen Datenquelle. Das heißt, sie wurden zuvor durch einen Datenfluss erstellt und dann wiederverwendet.

Berechnete Tabellen können durch Verweisen auf eine Tabelle im gleichen Datenfluss oder durch Verweisen auf eine Tabelle erstellt werden, die in einem anderen Datenfluss erstellt wurde.

Screenshot mit Hervorhebung einer berechneten Tabelle.

Warum wird eine berechnete Tabelle verwendet?

Das Ausführen aller Transformationsschritte in einer Tabelle kann langsam sein. Es kann viele Gründe für diese Verlangsamung geben– die Datenquelle ist möglicherweise langsam, oder die Transformationen, die Sie ausführen, müssen in zwei oder mehr Abfragen repliziert werden. Es kann vorteilhaft sein, zuerst die Daten aus der Quelle aufzunehmen und dann in einer oder mehreren Tabellen wiederzuverwenden. In solchen Fällen können Sie zwei Tabellen erstellen: eine, die Daten aus der Datenquelle abruft, und eine andere – eine berechnete Tabelle – die mehr Transformationen auf Daten anwendet, die bereits in den von einem Datenfluss verwendeten Datensee geschrieben wurden. Diese Änderung kann die Leistung und Wiederverwendbarkeit von Daten erhöhen und Zeit und Ressourcen sparen.

Wenn z. B. zwei Tabellen sogar einen Teil ihrer Transformationslogik gemeinsam nutzen, ohne dass eine berechnete Tabelle vorhanden ist, muss die Transformation zweimal durchgeführt werden.

Abbildung der zweimaligen Transformation von Daten.

Wenn jedoch eine berechnete Tabelle verwendet wird, wird der gemeinsame (freigegebene) Teil der Transformation einmal verarbeitet und in Azure Data Lake Storage gespeichert. Die verbleibenden Transformationen werden dann aus der Ausgabe der gemeinsamen Transformation verarbeitet. Insgesamt ist diese Verarbeitung viel schneller.

Abbildung allgemeiner Transformationen, die einmal in der berechneten Tabelle durchgeführt und im Datensee gespeichert sind, und die verbleibenden eindeutigen Transformationen, die später auftreten.

Eine berechnete Tabelle stellt eine Stelle als Quellcode für die Transformation bereit und beschleunigt die Transformation, da sie nur einmal statt mehrmals ausgeführt werden muss. Die Auslastung der Datenquelle wird ebenfalls reduziert.

Beispielszenario für die Verwendung einer berechneten Tabelle

Wenn Sie eine aggregierte Tabelle in Power BI erstellen, um das Datenmodell zu beschleunigen, können Sie die aggregierte Tabelle erstellen, indem Sie auf die ursprüngliche Tabelle verweisen und weitere Transformationen darauf anwenden. Mit diesem Ansatz müssen Sie Ihre Transformation nicht aus der Quelle replizieren (der Teil aus der ursprünglichen Tabelle).

Die folgende Abbildung zeigt beispielsweise eine Tabelle "Bestellungen".

Screenshot der Tabelle

Mithilfe eines Verweises aus dieser Tabelle können Sie eine berechnete Tabelle erstellen.

Erstellen einer berechneten Tabelle.

Screenshot, der zeigt, wie Sie eine berechnete Tabelle aus der Tabelle "Bestellungen" erstellen. Klicken Sie zuerst im Abfragenbereich mit der rechten Maustaste auf die Tabelle "Bestellungen" und wählen Sie im Dropdownmenü die Option "Verweis" aus. Diese Aktion erstellt die berechnete Tabelle, die hier in "Bestellungen aggregiert" umbenannt wird.

Die berechnete Tabelle kann weitere Transformationen aufweisen. Sie können beispielsweise "Group By " verwenden, um die Daten auf Kundenebene zu aggregieren.

Screenshot der aggregierten Tabelle

Dies bedeutet, dass die Tabelle "Orders Aggregated" Daten aus der Tabelle "Bestellungen" abruft und nicht erneut aus der Datenquelle. Da einige der Transformationen, die erledigt werden müssen, bereits in der Tabelle "Bestellungen" durchgeführt wurden, ist die Leistung besser und die Datentransformation ist schneller.

Berechnete Tabelle in anderen Datenflüssen

Sie können auch eine berechnete Tabelle in anderen Datenflüssen erstellen. Sie kann durch Abrufen von Daten aus einem Datenfluss mit dem Microsoft Power Platform-Datenflussconnector erstellt werden.

Abrufen von Daten aus Power Platform-Datenflüssen.

Das Bild hebt den Power Platform-Datenflusskonnektor aus dem Power Query-Datenquellenfenster hervor. Außerdem ist eine Beschreibung enthalten, die besagt, dass eine Datenflusstabelle auf den Daten aus einer anderen Datenflusstabelle aufgebaut werden kann, die bereits im Speicher gespeichert ist.

Das Konzept der berechneten Tabelle besteht darin, eine Tabelle im Speicher persistent abzulegen und andere Tabellen davon abzuleiten, um die Lesezeit von der Datenquelle zu verkürzen und einige gemeinsame Transformationen zu teilen. Diese Reduzierung kann erreicht werden, indem Daten aus anderen Datenflüssen über den Datenflussconnector abgerufen oder auf eine andere Abfrage im gleichen Datenfluss verwiesen wird.

Berechnete Tabelle: Mit Transformationen oder ohne?

Da Sie nun wissen, dass berechnete Tabellen hervorragend zur Verbesserung der Leistung der Datentransformation geeignet sind, ist eine gute Frage, ob Transformationen immer auf die berechnete Tabelle zurückgestellt werden sollen oder ob sie auf die Quelltabelle angewendet werden sollen. Das heißt, sollten Daten immer in eine Tabelle aufgenommen und dann in einer berechneten Tabelle transformiert werden? Was sind die Vor- und Nachteile?

Laden von Daten ohne Transformation für Text-/CSV-Dateien

Wenn eine Datenquelle die Abfragefaltung (z. B. Text-/CSV-Dateien) nicht unterstützt, bietet es wenig Vorteile beim Anwenden von Transformationen beim Abrufen von Daten aus der Quelle, insbesondere, wenn Datenvolumes groß sind. Die Quelltabelle sollte nur Daten aus der Text-/CSV-Datei laden, ohne Transformationen anzuwenden. Anschließend können berechnete Tabellen Daten aus der Quelltabelle abrufen und die Transformation über den aufgenommenen Daten ausführen.

Vielleicht fragen Sie, was ist der Wert der Erstellung einer Quelltabelle, die nur Daten erfasst? Eine solche Tabelle kann weiterhin nützlich sein, weil die Verwendung von Daten aus der Quelle in mehreren Tabellen die Auslastung der Datenquelle verringert. Darüber hinaus können Daten jetzt von anderen Personen und Datenflüssen wiederverwendet werden. Berechnete Tabellen sind besonders nützlich in Szenarien, in denen das Datenvolume groß ist oder wenn über ein lokales Datengateway auf eine Datenquelle zugegriffen wird, da sie den Datenverkehr vom Gateway und die Last der zugrunde liegende Datenquellen reduzieren.

Ausführen einiger gängiger Transformationen für eine SQL-Tabelle

Wenn Ihre Datenquelle Abfragefaltung unterstützt, empfiehlt es sich, einige der Transformationen in der Quelltabelle auszuführen, da die Abfrage in die Datenquelle gefaltet wird und nur die transformierten Daten daraus abgerufen werden. Diese Änderungen verbessern die Gesamtleistung. Der Satz von Transformationen, die in nachgelagerten berechneten Tabellen häufig vorkommen, sollte auf die Quelltabelle angewendet werden, damit sie zur Quelle zurückgeführt werden können. Andere Transformationen, die nur für nachgeschaltete Tabellen gelten, sollten in berechneten Tabellen erfolgen.