Partager via


Mettre en œuvre l’architecture de médaillon avec des vues sur le lac matérialisées

Ce tutoriel décrit les étapes et considérations relatives à l’implémentation d’une architecture de médaillon à l’aide de vues matérialisées sur le lac. À la fin de ce tutoriel, vous découvrirez les principales caractéristiques et fonctionnalités des vues matérialisées sur le lac et serez en mesure de créer un flux de travail automatisé pour la transformation de données. Ce tutoriel n’est pas destiné à être une architecture de référence, une liste exhaustive de caractéristiques et de fonctionnalités ou une recommandation de meilleures pratiques spécifiques.

Conditions préalables

En tant que prérequis pour ce tutoriel, effectuez les étapes suivantes :

  1. Connectez-vous à votre compte Power BI , ou si vous n’avez pas encore de compte, inscrivez-vous à un essai gratuit.
  2. Activez Microsoft Fabric dans votre locataire. Sélectionnez l’icône Power BI par défaut en bas à gauche de l’écran, puis sélectionnez Fabric.
  3. Créez un espace de travail activé pour Microsoft Fabric.
  4. Sélectionnez un espace de travail sous l’onglet Espaces de travail, puis sélectionnez + Nouvel élément, puis choisissez Pipeline. Indiquez un nom pour votre pipeline, puis sélectionnez Créer.
  5. Créez un Lakehouse avec des schémas activés . Nommez-le SalesLakehouse et chargez des exemples de fichiers de données dans Lakehouse. Pour plus d’informations, consultez le didacticiel Lakehouse.

Vue d’ensemble du scénario

Dans ce tutoriel, vous allez prendre un exemple d’une organisation de vente au détail fictive, Contoso, qui utilise une architecture de médaillon pour l’analytique des données afin d’obtenir des insights exploitables sur ses opérations de vente au détail. Il vise à rationaliser le processus d’analyse et à générer des insights plus approfondis sur les performances de l’entreprise en organisant leurs données en trois couches : bronze (données brutes), argent (données nettoyées et enrichies) et or (données agrégées et analysées).

Le diagramme suivant représente différentes entités dans chaque couche d’architecture de médaillon dans SalesLakehouse :

Capture d’écran montrant l’architecture de médaillon.

Entités

  1. Commandes : cette entité inclut des détails sur chaque commande client, telles que la date de commande, les détails de l’expédition, la catégorie de produit et la sous-catégorie. Vous pouvez tirer des insights pour optimiser les stratégies d’expédition, identifier les catégories de produits populaires et améliorer la gestion des commandes.

  2. Ventes : en analysant les données de ventes, Contoso peut évaluer les métriques clés telles que le chiffre d’affaires total, les marges de profit, les priorités de commande et les remises. Les corrélations entre ces facteurs fournissent une compréhension plus claire des comportements d’achat des clients et de l’efficacité des stratégies de remise.

  3. Emplacement : cela capture la dimension géographique des ventes et des commandes, notamment les villes, les états, les régions et les segments clients. Contoso permet à Contoso d’identifier les régions hautes performances, d’aborder des zones peu performantes et de personnaliser des stratégies pour des segments de clients spécifiques.

  4. Performances de l’agent : avec des détails sur les agents gérant les transactions, leurs commissions et leurs données de vente, Contoso peut évaluer les performances des agents individuels, encourager les meilleurs interprètes et concevoir des structures de commission efficaces.

  5. Commissions d’agent : l’incorporation des données de commission garantit la transparence et permet une meilleure gestion des coûts. La compréhension de la corrélation entre les taux de commission et les performances de l’agent permet d’affiner les systèmes d’incitation.

Exemple de jeu de données

Contoso gère ses données brutes d’opérations de vente au détail au format CSV au sein d’ADLS Gen2. Nous utilisons ces données pour créer la couche bronze, puis utiliser la couche bronze pour créer les vues matérialisées du lac qui forment les couches argent et or de l’architecture de médaillon. Tout d’abord, téléchargez les exemples de fichiers CSV à partir du dépôt d’exemples Fabric.

Créer le pipeline

Les étapes générales sont les suivantes :

  1. Couche bronze : ingérer des données brutes sous la forme de fichiers CSV dans le lakehouse.
  2. Couche Argent : nettoyer les données à l’aide de vues matérialisées de lac.
  3. Couche Gold : organisez des données pour l’analytique et la création de rapports à l’aide de vues matérialisées de lac.

Créer une couche de bronze de l'architecture analytique de médaillon des ventes

  1. Chargez les fichiers CSV correspondant à différentes entités à partir des données téléchargées dans Lakehouse. Pour ce faire, accédez à votre lakehouse et chargez les données téléchargées dans la section Fichiers de la lakehouse. Il crée un dossier nommé didacticiel.

  2. Ensuite, créez un raccourci vers celui-ci à partir de la section Tables . Sélectionnez ... en regard de la section Tables , puis sélectionnez Nouveau raccourci de schéma , puis Microsoft OneLake. Choisissez SalesLakehouse parmi les types de sources de données. Développez la section Fichiers et choisissez le dossier du didacticiel , puis sélectionnez Créer. Vous pouvez également utiliser d'autres options pour intégrer des données dans le Lakehouse.

    Capture d’écran montrant comment créer un raccourci pour obtenir les données dans des tables.

  3. Dans la section Tables , renommez le dossier du didacticiel en bronze.

    Capture d’écran montrant la création d’une couche bronze.

Créer des éléments en argent et en or dans l'architecture médaillonnée

  1. Chargez le fichier de notebook téléchargé dans votre espace de travail.

    Capture d’écran montrant la création d’un lac argenté matérialisé.

  2. Ouvrez le notebook à partir de Lakehouse. Pour plus d’informations, consultez Explorer les données du lac avec un carnet de notes.

  3. Exécutez toutes les cellules du notebook à l’aide de Spark SQL pour créer des vues de lac matérialisées avec des contraintes de qualité des données. Une fois que toutes les cellules sont correctement exécutées, actualisez la source SalesLakehouse pour afficher les vues de lac matérialisées nouvellement créées pour le schéma argent et or .

    Capture d’écran montrant exécuter le bloc-notes.

Planifier le pipeline

  1. Une fois que les vues matérialisées du lac pour les couches d’argent et d’or sont créées, accédez au lakehouse et sélectionnez Vue de lac matérialisée managée pour voir la vue de traçabilité. Il est généré automatiquement en fonction des dépendances, chaque vue matérialisée dépendante forme les nœuds de la filiation.

    Capture d’écran montrant la vue matérialisée du lac.

    Capture d’écran montrant la création de la lignée.

  2. Sélectionnez Planifier dans le ruban de navigation. Activez l’actualisation et configurez la planification.

    Capture d’écran montrant la planification de l'exécution des vues matérialisées du lac.

Surveillance et dépannage

  1. Le menu déroulant répertorie les versions actuelles et historiques.

    Capture d’écran montrant la planification de l’exécution.

  2. En sélectionnant l’une des exécutions, vous trouverez les détails matérialisés de la vue lac sur le volet latéral droit. Le panneau d’activité inférieur fournit une vue d’ensemble générale de l’état d’exécution des nœuds.

    Capture d’écran montrant les détails de l’exécution.

  3. Sélectionnez n’importe quel nœud dans la traçabilité pour afficher les détails de l’exécution du nœud et accéder aux journaux détaillés. Si l’état du nœud a échoué, un message d’erreur s’affiche également.

    Capture d’écran présentant les logs détaillés de l’exécution.

  4. Si vous sélectionnez le lien Des journaux détaillés , vous êtes redirigé vers le Hub Monitor à partir duquel vous pouvez accéder aux journaux d’erreurs Spark pour une résolution plus approfondie des problèmes.

    Capture d’écran montrant les journaux Spark.

  5. Sélectionnez le bouton Rapport de qualité des données sur le ruban de la page de vues matérialisées du lac, pour créer ou afficher un rapport de qualité des données généré automatiquement.