Créer et gérer des agrégations

Effectué

Lorsque vous agrégez des données, vous les résumez et les présentez avec un niveau de granularité supérieur. Par exemple, vous pouvez résumer les données commerciales et les regrouper par date, client, produit, etc. Le processus d’agrégation réduit la taille des tables dans le modèle sémantique, ce qui vous permet de vous concentrer sur les données importantes et d’améliorer les performances des requêtes.

Schéma illustrant la théorie sous-jacente à l’agrégation des données.

Votre organisation peut décider d’utiliser des agrégations dans ses modèles sémantiques pour les raisons suivantes :

  • Vous utilisez de gros volumes de données. Dans ce cas, les agrégations offrent de meilleures performances de requête et vous permettent d’analyser et de révéler des insights sur ces données volumineuses. Les données agrégées étant mises en cache, elles utilisent bien moins de ressources que celles nécessaires pour les données détaillées.
  • L’actualisation des données est lente. Dans ce cas, les agrégations permettent d’accélérer le processus d’actualisation. La taille de cache étant plus petite, le temps d’actualisation est réduit et les utilisateurs disposent des données plus rapidement. Au lieu d’actualiser des millions de lignes, vous actualisez un plus petit volume de données.
  • Vous disposez d’un grand modèle sémantique. Dans ce cas, les agrégations permettent de réduire et maintenir la taille de votre modèle.
  • Vous anticipez la croissance future de votre modèle sémantique. Dans ce cas, vous pouvez utiliser les agrégations comme une étape proactive vers la pérennité de votre modèle sémantique en réduisant les risques potentiels de problèmes de performance et d’actualisation et les problèmes généraux liés aux requêtes.

Dans le cadre du scénario Tailwind Traders, vous avez pris plusieurs mesures pour optimiser les performances du modèle sémantique, mais l’équipe informatique vous a informé que la taille du fichier est toujours trop grande. La taille du fichier est actuellement de 1 gigaoctet (Go). Vous devez donc la réduire à environ 50 mégaoctets (Mo). Lors de votre évaluation des performances, vous avez identifié que le développeur précédent n’avait pas utilisé d’agrégations dans le modèle sémantique. Vous souhaitez donc maintenant créer des agrégations pour les données commerciales afin de réduire la taille du fichier et d’optimiser davantage les performances.

Créer des agrégations

Avant de créer des agrégations, vous devez décider du niveau de granularité auquel vous souhaitez les créer. Dans cet exemple, vous souhaitez agréger les données commerciales par jour.

Une fois le niveau de granularité choisi, l’étape suivante consiste à décider de la façon dont vous souhaitez créer les agrégations. Vous pouvez créer les agrégations de différentes façons et chaque méthode produit les mêmes résultats, par exemple :

  • Si vous avez accès à la base de données, vous pouvez créer une table (ou vue), puis l’importer dans Power BI Desktop.
  • Dans Power BI Desktop, vous pouvez créer les agrégations étape par étape à l’aide de Power Query.

Dans cet exemple, vous ouvrez une requête dans Power Query et remarquez que les données n’ont pas été agrégées ; elles comportent plus de 999 lignes, comme illustré dans la capture d’écran suivante :

Capture d’écran affichant le nombre total de lignes avant l’agrégation.

Vous souhaitez effectuer un regroupement selon la colonne OrderDate et résumer les colonnes OrderQuantity et SalesAmount. Commencez par cliquer sur Choisir des colonnes dans l’onglet de ruban Accueil. Dans la fenêtre qui s’ouvre, sélectionnez les colonnes souhaitées dans l’agrégation, puis cliquez sur OK.

Capture d’écran montrant comment choisir des colonnes lors de l’agrégation des données.

Lorsque les colonnes sélectionnées s’affichent sur la page, cliquez sur le bouton Grouper par dans l’onglet de ruban Accueil. Dans la fenêtre qui s’ouvre, sélectionnez la colonne que vous souhaitez grouper par (OrderDate) et saisissez un nom pour la nouvelle colonne (OnlineOrdersCount).

Sélectionnez l’option Avancé, puis cliquez sur le bouton Ajouter une agrégation pour configurer une autre ligne de colonne. Saisissez un nom pour la colonne d’agrégation et sélectionnez l’opération de la colonne, puis la colonne à laquelle vous souhaitez lier l’agrégation. Répétez ces étapes jusqu’à ce que vous ayez ajouté toutes les agrégations, puis cliquez sur OK.

Capture d’écran montrant comment utiliser le bouton Grouper par.

L’affichage d’une version préliminaire de votre agrégation peut prendre quelques minutes, mais lorsque c’est le cas, vous voyez comment les données ont été transformées. Les données sont agrégées pour chaque date, avec pour chacune le nombre de commandes ainsi que les sommes respectives du montant des ventes et de la quantité commandée.

Capture d’écran de la table obtenue après l’agrégation.

Cliquez sur le bouton Fermer et appliquer pour fermer l’Éditeur Power Query et appliquer les modifications à votre modèle sémantique. Dans Power BI Desktop, cliquez sur Actualiser dans l’onglet de ruban Accueil. Observez l’écran, car un bref message affiche le nombre de lignes que votre modèle sémantique a chargées. Ce nombre de lignes devrait être considérablement inférieur au nombre initial. Vous pouvez également voir ce nombre lorsque vous rouvrez l’Éditeur Power Query, comme illustré dans la capture d’écran suivante. Dans cet exemple, le nombre de lignes a été réduit à 30.

Capture d’écran du nombre total de lignes et de colonnes après l’agrégation.

N’oubliez pas que vous avez commencé avec plus de 999 lignes. L’utilisation de l’agrégation a considérablement réduit le nombre de lignes dans votre modèle sémantique. Autrement dit, Power BI doit actualiser moins de données et votre modèle devrait mieux fonctionner.

Gérer les agrégations

Vous pouvez ensuite gérer les agrégations dans Power BI Desktop pour apporter des modifications à leur comportement, si nécessaire.

Vous pouvez ouvrir la fenêtre Gérer les agrégations à partir de toute vue dans Power BI Desktop. Dans le volet Données, cliquez avec le bouton droit sur la table, puis sélectionnez Gérer les agrégations.

Capture d’écran illustrant la fenêtre Gérer les agrégations.

Pour chaque colonne d’agrégation, vous pouvez sélectionner une option dans la liste déroulante Résumé et apporter des modifications à la table et à la colonne de détails sélectionnées. Après avoir géré les agrégations, cliquez sur Appliquer tout.

Pour en savoir plus sur la création et la gestion des agrégations, consultez Utiliser des agrégations dans Power BI Desktop.