Partager via


Tarification de Dataflow Gen2 pour Data Factory dans Microsoft Fabric

Dataflow Gen2 vous permet de mettre en forme et de transformer facilement des données. Il offre une interface à faible code et plus de 300 transformations intégrées de données et d’IA, toutes alimentées par l’expérience Power Query familière que vous trouverez dans Excel, Power BI, Power Platform et Dynamics 365.

Lorsque vous publiez un dataflow, il crée une définition qui s’exécute pendant l’actualisation. Le moteur Dataflow Gen2 utilise cette définition pour planifier et gérer l’exécution des requêtes sur les sources de données, les passerelles et les moteurs de calcul. Il construit des tables dans le stockage intermédiaire ou les envoie vers la destination de votre choix, pour vous permettre d'obtenir des résultats fiables sans effort supplémentaire.

Schéma de l’architecture Dataflow Gen2.

Le diagramme capture les composants de l'architecture DataFlow Gen2 Data Factory, notamment le Lakehouse utilisé pour stocker les données ingérées et le Warehouse, utilisé comme moteur de calcul pour écrire des résultats dans la zone de préparation ou en sortie de manière plus rapide. Lorsque le calcul de l’entrepôt ne peut pas être utilisé ou lorsque la préproduction est désactivée pour une requête, le moteur Mashup extrait, transforme ou charge les données dans des destinations intermédiaires ou de données. Vous pouvez en savoir plus sur le fonctionnement de Dataflow Gen2 dans ce blog : Data Factory Spotlight : DataFlow Gen2.

Lorsque vous actualisez ou publiez un élément Dataflow Gen2, les unités de capacité fabric sont consommées pour les moteurs suivants :

  • Calcul standard : vous êtes facturé pour celui-ci en fonction du temps d’évaluation des requêtes sur toutes vos requêtes dataflow qui s’exécutent via le moteur Mashup.
  • Calcul de flux de données à grande échelle : vous êtes facturé lorsque la mise en scène est activée, en fonction de la durée d'utilisation du moteur SQL du Lakehouse (stockage de mise en scène) et du Warehouse (calcul de traitement).
  • Copie rapide : Vous êtes facturé lorsque les connecteurs de copie rapide sont activés et peuvent être utilisés dans le Dataflow, selon la durée du travail de copie.

Modèle de tarification de Dataflow Gen2

Détermination des tarifs

La tarification dataflow Gen2 dépend de la façon dont chaque requête utilise le calcul. Pour le calcul standard, les requêtes s’exécutent sur le moteur mashup. Selon que votre flux de données est Dataflow Gen2 (CI/CD), l’évaluation varie.

Dans Dataflow Gen2 (CI/CD), un taux à deux niveaux est appliqué à la durée de la requête :

  • Si une requête s’exécute en moins de 10 minutes, elle est évaluée à 12 CU
  • S’il s’exécute plus longtemps, chaque seconde supplémentaire est facturée à 1,5 unité de calcul (CU).

Si votre Dataflow Gen2 n’est pas CI/CD, le taux est de 16 CU appliqué à toute la durée de la requête.

Pour les scénarios à grande échelle ( lorsque la mise en lots est activée), les requêtes s’exécutent sur le moteur SQL Lakehouse ou Warehouse. Chaque seconde de temps de calcul utilise 6 CU secondes, de sorte que les requêtes plus longues consomment plus.

Si vous activez la copie rapide, il existe un débit distinct pour le déplacement des données : 1,5 CU, en fonction de la durée d’exécution de l’activité.

À la fin de chaque exécution, Dataflow Gen2 additionne l'utilisation des UC de chaque moteur et la facture en fonction de la tarification de la capacité Fabric dans votre région.

Tableau des taux CU

Type de moteur Dataflow Gen2 Compteurs de consommation Taux de consommation en CU Fabric Granularité des rapports de consommation
Ordinateur standard (Dataflow Gen2 (CI/CD)) En fonction de chaque durée d’exécution de requête du moteur mashup en secondes. Le calcul standard a deux niveaux de tarification en fonction de la durée de la requête. - Pendant toutes les secondes jusqu’à 10 minutes, 12 CU
- Pour chaque seconde au-delà de 10 minutes, 1,5 CU
Par élément Dataflow Gen2
Calcul informatique standard (hors CI/CD) En fonction de chaque durée d’exécution de requête du moteur mashup en secondes. 16 CU Par élément Dataflow Gen2
Calcul des flux de données à grande échelle En fonction de la durée d’exécution (sans préproduction activée) du moteur SQL lakehouse/entrepôt en secondes. 6 unités de calcul (UC) Par espace de travail
Déplacement des données En fonction de la durée d’exécution de Fast Copy en secondes et des ressources utilisées pour l'optimisation intelligente du débit. 1.5 unité(s) CU Par élément Dataflow Gen2

Tarification de la passerelle de données du réseau virtuel avec Dataflow Gen2

La passerelle de données du réseau virtuel (VNET) est facturée comme une redevance d'infrastructure additive, associée à une capacité de tissu. Cela signifie qu'il dispose de son propre compteur et qu'il fait l'objet d'une facture cohérente et supplémentaire pour toutes les courses de Fabric item.

La facture totale pour l’exécution de Dataflow Gen2 via la passerelle de données de réseau virtuel est calculée comme suit : Frais de dataflow Gen2 + frais de passerelle de données de réseau virtuel.

Les frais de la passerelle de données VNET sont proportionnels à votre utilisation de la passerelle de données VNET, l'utilisation étant définie comme le temps de fonctionnement, ou chaque fois que la passerelle de données VNET est activée.

Taux de consommation de CU pour le Data Gateway VNET : 4 CU

Pour en savoir plus, consultez le site Prix et facturation des passerelles de données du réseau virtuel.

Modifications apportées au taux de consommation des charges de travail Microsoft Fabric

Les taux de consommation sont susceptibles de changer à tout moment. Microsoft utilise des efforts raisonnables pour fournir une notification par e-mail et dans le produit. Les modifications sont effectives à la date indiquée dans les notes de publication et le blog Microsoft Fabric. Si une modification apportée à un taux de consommation de charge de travail Microsoft Fabric augmente matériellement les unités de capacité (CU) requises pour utiliser une charge de travail particulière, les clients peuvent utiliser les options d’annulation disponibles pour le mode de paiement choisi.

Calculer les coûts estimés à l’aide de l’application Métriques Fabric et de l’historique d’actualisation du flux de données

L’application de métriques de capacité Microsoft Fabric offre une visibilité de l’utilisation de la capacité pour tous les espaces de travail Fabric liés à une capacité. Elle est principalement utilisée par les administrateurs de capacité pour surveiller les performances des charges de travail et leur utilisation, par rapport à la capacité achetée. L’utilisation de l’application de métriques est le moyen le plus précis d’estimer les coûts des exécutions d’actualisation de Dataflow Gen2. Pour comprendre comment la tarification hiérarchisée a affecté vos coûts de calcul standard, vous devez également utiliser l’historique d’actualisation de Dataflow.

Ces exercices vous montrent comment valider les coûts des flux de données CI/CD et non CI/CD. Pour le flux de données CI/CD avec un calcul standard, nous allons utiliser un exemple et nous fournirons des instructions pour tous les autres scénarios.

Exercice 1 : Calcul standard pour un flux de données CI/CD

Le flux de données suivant comporte deux requêtes impliquant la transformation et la mise en lots est désactivée.

Capture d’écran montrant Dataflow Gen2 avec deux requêtes.

Capture d’écran montrant Dataflow Gen2 avec la mise en lots désactivée.

Dataflow Gen2 utilise uniquement le calcul standard.

Pour chaque requête, accédez à la durée de la requête à partir de l’historique d’actualisation et appliquez la formule suivante pour calculer la consommation de CU par requête.

Pour la première requête, la durée est de 2 131 secondes.

Capture d’écran montrant l’historique d’actualisation de la requête 1.

De même, pour la deuxième requête, la durée est de 913 secondes

Capture d’écran montrant l’historique des actualisations de la requête 2.

StandardComputeCapacityConsumptionInCUSeconds = if(QueryDurationInSeconds < 600, QueryDurationInSeconds x 12, (QueryDurationInSeconds - 600) x 1.5 + 600 x 12)

Pour la requête 1, la consommation calculée est de 9497 CU secondes et pour la requête 2, la consommation calculée est de 7670 CU secondes.

Agréger la consommation de capacité en CU secondes et valider la consommation dans l'application Fabric dédiée aux métriques de capacité. Dans ce scénario, l'application de métriques affiche 17 180 secondes CU d'utilisation de calcul standard, ce qui se compare bien à la consommation calculée de 17 167 secondes CU. Les écarts peuvent résulter de l’arrondi dans les rapports périodiques d’utilisation.

Capture d’écran montrant l’application Fabric Capacity Metrics montrant la consommation de flux de données.

Exercice 2 : Calcul standard pour un dataflow non-CI/CD

Lorsque votre dataflow implique une transformation et que la préparation est désactivée, Dataflow Gen2 utilisera uniquement le calcul standard.

Pour chaque requête, accédez à la durée de la requête à partir de l’historique d’actualisation et appliquez la formule suivante pour calculer la consommation de CU par requête.

StandardComputeCapacityConsumptionInCUSeconds = QueryDurationInSeconds x 16

Agréger la consommation de capacité en CU secondes et valider la consommation dans l'application Fabric dédiée aux métriques de capacité.

Exercice 3 : Présentation de la consommation de calcul à grande échelle (flux de données CI/CD et non CI/CD)

Si votre dataflow utilise la mise en scène, pour déterminer la quantité de calcul haute capacité que vous avez utilisée, ouvrez l’application Fabric Capacity Metrics et filtrez par le nom de votre dataflow. Cliquez avec le bouton droit sur le nom, recherchez le calcul à grande échelle dans la liste des opérations, puis vérifiez la durée.

HighScaleComputeCapacityConsumptionInCUSeconds = QueryDurationInSeconds x 6

Exercice 4 : Présentation de la consommation de calcul de copie rapide (flux de données CI/CD et non-CI/CD)

Si votre dataflow utilise une copie rapide, pour déterminer la quantité de calcul de déplacement des données que vous avez utilisée, ouvrez l’application Métriques de capacité Fabric et filtrez par le nom de votre dataflow. Cliquez avec le bouton droit sur le nom, recherchez déplacement des données dans la liste des opérations, puis vérifiez la durée.

FastCopyComputeCapacityConsumptionInCUSeconds = QueryDurationInSeconds x 1.5