Flux de données

Effectué

Les flux de données sont des services d’extraction, de transformation et de chargement (ETL) basés sur le cloud qui permettent d’ingérer des données provenant de diverses sources, puis de les convertir en formulaire prêt pour l’analyse. Les flux de données permettent à Power BI de traiter et d’ingérer de gros volumes de données.

Schéma illustrant le processus relatif aux flux de données dans les tableaux de bord.

Les flux de données sont conçus pour prendre en charge les scénarios suivants :

  • Créez une logique de transformation réutilisable que de nombreux jeux de données et états dans Power BI peuvent partager. Les flux de données favorisent la réutilisation des éléments de données sous-jacents, ce qui évite d’avoir à créer des connexions distinctes avec vos sources de données cloud ou locales.
  • Exposez les données dans votre propre instance Azure Data Lake Gen 2 Storage, ce qui vous permet de connecter d’autres services Azure aux données sous-jacentes brutes.
  • Créez une source unique de vérité en forçant les analystes à se connecter aux flux de données plutôt qu’aux systèmes sous-jacents. Vous pouvez ainsi contrôler les données consultées et la présentation des données aux créateurs d’états. Vous pouvez également mapper les données à des définitions standard sectorielles, ce qui vous permet de créer des vues bien organisées. Ces vues sont compatibles avec d’autres services et produits dans Microsoft Power Platform.
  • Si vous souhaitez utiliser de gros volumes de données et effectuer un processus ETL à grande échelle, les flux de données avec Power BI Premium évoluent plus efficacement et vous offrent plus de flexibilité. Les flux de données prennent en charge un large éventail de sources cloud et locales.
  • Empêchez les analystes d’avoir un accès direct à la source de données sous-jacente. Comme les créateurs d’états peuvent s’appuyer sur des flux de données, il peut être plus pratique d’accorder l’accès aux sources de données sous-jacentes à quelques personnes seulement. Ensuite, fournissez un accès aux flux de données afin que les analystes puissent s’appuyer dessus. Cette approche réduit la charge sur les systèmes sous-jacents et permet aux administrateurs de contrôler plus précisément le moment où les systèmes sont chargés à partir des actualisations.

Les flux de données peuvent transformer des données à l’aide de Power Query et les enrichir à l’aide de Microsoft Azure Cognitive Services et d’Azure Machine Learning, comme illustré dans le schéma suivant :

Schéma illustrant les fonctionnalités de flux de données.

Après avoir créé un flux de données, vous pouvez créer les éléments suivants utilisant Common Data Model à l’aide de Power BI Desktop et du service Power BI pour obtenir des insights approfondis sur vos données métier :

  • Jeux de données
  • États
  • Tableaux de bord
  • Applications

Les données exportées de Dataverse dans Azure Data Lake Storage peuvent être importées dans Power BI à l’aide de flux de données.

Jeu de données et flux de données

Les flux de données sont facultatifs, mais pas les jeux de données. Vous ne pouvez pas utiliser un flux de données directement ; le flux de données renseigne le jeu de données.

Si vous n’utilisez pas de flux de données mais uniquement des jeux de données, la préparation du jeu de données est effectuée à plusieurs reprises dans chaque jeu de données. Avec les flux de données, le flux de données effectue la préparation des données une seule fois, puis chaque jeu de données utilise la préparation prédéfinie. Les flux de données peuvent également comporter des entités calculées correspondant aux insights nécessaires à un état.

Vous utilisez toujours des jeux de données, mais vous pouvez choisir d’utiliser un flux de données si cela vous est utile.

Le service Azure Synapse Link permet la réplication continue des données de table Dataverse vers un compte Azure Data Lake Storage Gen 2 ou un espace de travail Azure Synapse workspace. Ensuite, il vous permet d’exécuter des analyses telles que le reporting Power BI, Microsoft Azure Machine Learning, l’entreposage de données et d’autres scénarios d’intégration.

Capture d’écran de l’exportation vers Data Lake.

Azure Synapse Link simplifie la complexité technique et administrative des tables d’exportation à des fins d’analyse. En sélectionnant quelques options simples, les clients peuvent lier leur environnement Dataverse à un lac de données dans leur abonnement Azure, puis sélectionner des tables et les exporter vers Azure Data Lake Storage. Toutes les modifications de données et de métadonnées (delta initial et incrémentiel) dans Dataverse sont automatiquement transférées vers Azure Data Lake Gen 2, sans actions supplémentaires.

Les données sont stockées au format Common Data Model, que Power BI et d’autres services d’analyse Azure peuvent utiliser.

Décisionnel d’entreprise

Le décisionnel d’entreprise, où les données sont extraites pour être utilisées dans des outils de reporting d’entreprise plus globaux, présente de nombreux avantages :

  • Il réduit la charge sur les magasins de données opérationnels.
  • Il permet la transformation et l’analyse historique.
  • Il permet une utilisation avec des outils de reporting provenant d’autres sources.

Le schéma suivant montre comment Azure Synapse Link permet d’extraire des données de Dataverse et de renseigner un espace de travail utilisable par des outils de reporting tels que Power BI :

Schéma illustrant Azure Synapse Link copiant des données vers le stockage ADLS Gen2 et Power BI se connectant à Azure Synapse Analytics.

Pour en savoir plus, consultez Conseils sur la modélisation de Power BI pour Power Platform.