Freigeben über


Dataflow Gen2-Preise für Data Factory in Microsoft Fabric

Dataflow Gen2 hilft Ihnen, Daten mühelos zu gestalten und zu transformieren. Es bietet eine Low-Code-Schnittstelle und über 300 integrierte Daten- und KI-Transformationen, die alle von der vertrauten Power Query-Oberfläche unterstützt werden, die Sie in Excel, Power BI, Power Platform und Dynamics 365 finden.

Wenn Sie einen Datenfluss veröffentlichen, wird eine Definition erstellt, die während der Aktualisierung ausgeführt wird. Das Dataflow Gen2-Modul verwendet diese Definition zum Planen und Verwalten der Ausführung von Abfragen über Datenquellen, Gateways und Computemodule hinweg. Es erstellt Tabellen im Stagingspeicher oder sendet sie an Ihr ausgewähltes Ziel, so erhalten Sie zuverlässige Ergebnisse ohne die schwere Arbeit.

Diagramm der Architektur „Dataflow Gen2“

Das Diagramm erfasst Komponenten der Data Factory Dataflow Gen2-Architektur, einschließlich des Lakehouse, das zur Zwischenspeicherung von Daten verwendet wird, und der Data Warehouse-Einheit, die als Rechenmodul genutzt wird, um Ergebnisse schneller in Staging oder Ausgabe zu schreiben. Wenn die Warehouse-Berechnung nicht verwendet werden kann oder wenn das Staging für eine Abfrage deaktiviert ist, extrahiert, transformiert oder lädt die Mashup-Engine die Daten in Staging- oder Datenziele. Weitere Informationen zur Funktionsweise von Dataflow Gen2 finden Sie in diesem Blog: Data Factory Spotlight: Dataflow Gen2.

Wenn Sie ein Dataflow Gen2-Element aktualisieren oder veröffentlichen, werden Fabric Capacity Units für die folgenden Module genutzt:

  • Standard-Compute: Sie werden dafür basierend auf der Abfrageauswertungszeit für alle Ihre Dataflow-Abfragen, die über die Mashup-Engine laufen, berechnet.
  • High Scale Dataflow Compute: Sie werden abgerechnet, wenn das Staging aktiviert ist, basierend auf der Dauer des Verbrauchs der Lakehouse (Staging Storage) und Warehouse (Storage Compute) SQL-Engine.
  • Schnellkopie: Ihnen werden Gebühren berechnet, wenn Schnellkopie-Connectors aktiviert sind und im Dataflow basierend auf der Dauer des Kopierauftrags genutzt werden.

Dataflow Gen2-Preismodell

Wie Preise festgelegt werden

Die Preisgestaltung von Dataflow Gen2 hängt davon ab, wie jede Abfrage Rechenressourcen nutzt. Für die Standard-Rechenleistung werden Abfragen auf der Mashup-Engine ausgeführt. Je nachdem, ob Ihr Dataflow Dataflow Gen2 (CI/CD) ist, variiert die Bewertung.

In Dataflow Gen2 (CI/CD) gibt es eine zweistufige Rate, die auf die Abfragedauer angewendet wird:

  • Wenn eine Abfrage unter 10 Minuten ausgeführt wird, wird sie mit 12 CU bewertet.
  • Wenn sie länger läuft, wird jede zusätzliche Sekunde mit 1,5 CU bewertet.

Wenn Ihr Dataflow Gen2 nicht CI/CD ist, beträgt die Rate 16 CU, die auf die gesamte Abfragedauer angewendet wird.

Für szenarien mit hoher Skalierung – wenn staging aktiviert ist – werden Abfragen auf dem SQL-Modul Lakehouse oder Warehouse ausgeführt. Jede Sekunde der Berechnungszeit verwendet 6 CU-Sekunden, sodass längere Abfragen mehr verbrauchen.

Wenn Sie schnelle Kopie aktivieren, gibt es eine separate Rate für die Datenverschiebung: 1,5 CU, je nachdem, wie lange die Aktivität ausgeführt wird.

Am Ende jeder Ausführung addiert Dataflow Gen2 die CU-Nutzung von jeder Engine und berechnet diese basierend auf den Fabric-Kapazitätspreisen in Ihrer Region.

CU-Zinstabelle

Dataflow Gen2-Enginetyp Verbrauchseinheiten Fabric CU-Verbrauchsrate Granularität der Verbrauchsmeldungen
Standard-Berechnung (Dataflow Gen2 (CI/CD)) Basierend auf jeder Ausführungsdauer der Mashup-Engine in Sekunden. Standard Compute verfügt je nach Abfragedauer über zwei Preisstufen. Für jede Sekunde innerhalb von bis zu 10 Minuten, 12 CU
- Für jede Sekunde über 10 Minuten, 1,5 CU
Dataflow Gen2-Element
Standard Compute (nicht CI/CD) Basierend auf jeder Ausführungsdauer der Mashup-Engine in Sekunden. 16 CU Dataflow Gen2-Element
Berechnen von Datenflüssen mit hoher Skalierung Basierend auf der Dauer der Ausführung der Lakehouse/Warehouse SQL-Engine (mit aktiviertem Staging) in Sekunden. 6 CU Pro Arbeitsbereich
Datenverschiebung Basierend auf der Laufzeit von Fast Copy in Sekunden und den verwendeten intelligenten Optimierungsdurchsatzressourcen. 1.5 CU Dataflow Gen2-Element

Preise für virtuelles Netzwerkdatengateway mit Dataflow Gen2

Das Datengateway des virtuellen Netzes (VNET) wird als zusätzliches Infrastrukturentgelt in Verbindung mit einer Fabric-Kapazität in Rechnung gestellt. Das bedeutet, dass es über eine eigene Verbrauchseinheit verfügt und Kosten verursacht, die über alle Fabric-Artikelläufe hinweg konsistent sind und zusätzlich anfallen.

Die Gesamtrechnung für die Ausführung von Dataflow Gen2 über das VNET-Datengateway wird berechnet als: Dataflow Gen2 Charge + VNET Data Gateway Charge.

Die Gebühr für das VNET Datengateway ist proportional zu Ihrer Nutzung des VNET Datengateways, wobei die Nutzung als Betriebszeit definiert ist, oder immer wenn das VNET Datengateway eingeschaltet ist.

VNET Data Gateway CU-Verbrauchsrate: 4 CU

Erfahren Sie mehr unter Preise und Abrechnung für virtuelle Netzwerkdatengateways.

Änderungen an der Workload-Verbrauchsrate von Microsoft Fabric

Die Verbrauchsraten können jederzeit geändert werden. Microsoft unternimmt angemessene Anstrengungen, um eine Benachrichtigung per E-Mail und über produktinterne Benachrichtigungen bereitzustellen. Änderungen gelten ab dem Datum, das in den Versionshinweisen und dem Microsoft Fabric-Blog angegeben ist. Wenn eine Änderung der Microsoft Fabric Workload-Verbrauchsrate die für die Nutzung eines bestimmten Workloads erforderlichen Kapazitätseinheiten (Capacity Units, CU) wesentlich erhöht, können Kunden die für die gewählte Zahlungsmethode verfügbaren Stornierungsoptionen nutzen.

Berechnen geschätzter Kosten mithilfe der Fabric-Metrik-App und des Datenflussaktualisierungsverlaufs

Die Microsoft Fabric-Kapazitätsmetriken-App bietet Einblicke in die Kapazitätsauslastung für alle Fabric-Arbeitsbereiche, die an eine Kapazität gebunden sind. Sie wird von Kapazitätsadministratoren verwendet, um die Leistung von Workloads und deren Nutzung im Vergleich zu erworbener Kapazität zu überwachen. Die Verwendung der Metrik-App ist die genaueste Methode, um die Kosten für Dataflow Gen2-Aktualisierungsausführungen zu schätzen. Um zu verstehen, wie sich die gestaffelten Preise auf Ihre Standardberechnungskosten auswirkten, müssen Sie auch den Dataflow-Aktualisierungsverlauf verwenden.

Diese Übungen zeigen Ihnen, wie Sie Kosten sowohl für CI/CD als auch für Nicht-CI/CD-Datenflüsse überprüfen. Für den CI/CD-Datenfluss mit Standardberechnung verwenden wir ein Beispiel, und wir geben Anweisungen für alle anderen Szenarien an.

Übung 1: Standardberechnung für einen CI/CD-Datenfluss

Der folgende Datenfluss verfügt über zwei Abfragen mit Transformation und Staging ist deaktiviert.

Screenshot mit Dataflow Gen2 mit zwei Abfragen.

Screenshot, der Dataflow Gen2 mit deaktivierter Staging-Funktion zeigt.

Dataflow Gen2 verwendet nur den Standard Compute.

Greifen Sie für jede Abfrage auf die Abfragedauer aus dem Aktualisierungsverlauf zu und wenden Sie die folgende Formel an, um die CU-Auslastung pro Abfrage zu berechnen.

Bei der ersten Abfrage beträgt die Dauer 2.131 Sekunden.

Screenshot des Aktualisierungsverlaufs von Abfrage 1.

Ebenso beträgt die Dauer für die zweite Abfrage 913 Sekunden.

Screenshot des Aktualisierungsverlaufs von Abfrage 2.

StandardComputeCapacityConsumptionInCUSeconds = if(QueryDurationInSeconds < 600, QueryDurationInSeconds x 12, (QueryDurationInSeconds - 600) x 1.5 + 600 x 12)

Bei Abfrage 1 beträgt der berechnete Verbrauch 9497 CU-Sekunden und für Abfrage 2 beträgt der berechnete Verbrauch 7670 CU-Sekunden.

Aggregieren Sie den Kapazitätsverbrauch in CU-Sekunden, und überprüfen Sie den Verbrauch in der Fabric-Kapazitätsmetrik-App. In diesem Szenario zeigt die Metrik-App 17.180 CU-Sekunden als Standard Compute-Nutzung an, die sich gut mit dem berechneten Verbrauch von 17.167 CU-Sekunden vergleichen kann. Etwaige Abweichungen können auf Rundungen bei der periodischen Berichterstattung über die Nutzung zurückzuführen sein.

Screenshot der Fabric-Kapazitätsmetriken-App, die den Verbrauch des Datenflusses zeigt.

Übung 2: Standardberechnung für einen Nicht-CI/CD-Datenfluss

Wenn Ihr Datenfluss eine Transformation beinhaltet und das Staging deaktiviert ist, verwendet Dataflow Gen2 nur die Standard-Compute-Einheit.

Greifen Sie für jede Abfrage auf die Abfragedauer aus dem Aktualisierungsverlauf zu und wenden Sie die folgende Formel an, um die CU-Auslastung pro Abfrage zu berechnen.

StandardComputeCapacityConsumptionInCUSeconds = QueryDurationInSeconds x 16

Aggregieren Sie den Kapazitätsverbrauch in CU-Sekunden, und überprüfen Sie den Verbrauch in der Fabric-Kapazitätsmetrik-App.

Übung 3: Verständnis des Verbrauchs von Hochskalierungsberechnungen (sowohl CI/CD- als auch Nicht-CI/CD-Datenflüsse)

Wenn Ihr Dataflow Staging verwendet, öffnen Sie die Fabric Capacity Metrics App, und filtern Sie nach dem Namen Ihres Dataflows, um herauszufinden, wie viel Hochskalierung Sie verwendet haben. Klicken Sie mit der rechten Maustaste auf den Namen, suchen Sie in der Liste der Vorgänge nach hochskalierter Berechnung, und überprüfen Sie die Dauer.

HighScaleComputeCapacityConsumptionInCUSeconds = QueryDurationInSeconds x 6

Übung 4: Verständnis des Ressourcenverbrauchs bei schnellen Kopierprozessen (sowohl CI/CD als auch Nicht-CI/CD-Datenflüsse)

Wenn Ihr Datenfluss schnelle Kopie verwendet, öffnen Sie die Fabric Capacity Metrics App und filtern Sie nach dem Namen Ihres Datenflows, um herauszufinden, wie viel Datenbewegungs-Compute Sie verwendet haben. Klicken Sie mit der rechten Maustaste auf den Namen, suchen Sie in der Liste der Vorgänge nach "Datenbewegung", und überprüfen Sie die Dauer.

FastCopyComputeCapacityConsumptionInCUSeconds = QueryDurationInSeconds x 1.5