Partager via


Regroupement ou récapitulation des lignes

Dans Power Query, vous pouvez regrouper des valeurs dans différentes lignes en une seule valeur en regroupant les lignes en fonction des valeurs d’une ou plusieurs colonnes. Vous pouvez choisir parmi deux types d’opérations de regroupement :

  • Regroupements de colonnes.

  • Regroupements de lignes.

Pour ce tutoriel, vous utilisez l’exemple de tableau suivant.

Exemple de table initiale.

Capture d’écran d’un tableau avec des colonnes montrant Année (2020), Pays (États-Unis, Panama ou Canada), Produit (Chemise ou Short), Canal de vente (En ligne ou Revendeur) et Unités (différentes valeurs comprises entre 55 et 7500)

Où trouver le bouton Grouper par

Vous pouvez trouver le bouton Grouper par trois emplacements :

  • Sous l’onglet Accueil , dans le groupe Transformer .

    Capture d’écran du ruban Power Query avec l’option Grouper par option mise en évidence dans l’onglet Accueil.

  • Sous l’onglet Transformation , dans le groupe Tableau .

    Capture d’écran du ruban Power Query avec l’option Grouper par option mise en évidence sous l’onglet Transformation.

  • Dans le menu contextuel, lorsque vous cliquez avec le bouton droit pour sélectionner des colonnes.

    Capture d’écran d’un tableau avec l’option Grouper par option mise en évidence dans le menu contextuel.

Utiliser une fonction d’agrégation pour regrouper par une ou plusieurs colonnes

Dans cet exemple, votre objectif est de résumer le total des unités vendues au niveau du pays et du canal de vente. Vous utilisez les colonnes Country et Sales Channel pour effectuer l'opération de regroupement.

  1. Sélectionnez Regrouper par sous l’onglet Accueil .
  2. Sélectionnez l’option Avancé pour pouvoir sélectionner plusieurs colonnes à regrouper.
  3. Sélectionnez la colonne Country .
  4. Sélectionnez Ajouter un regroupement.
  5. Sélectionnez la colonne Sales Channel .
  6. Dans Nouveau nom de colonne, entrez Unités totales, dans Opération, sélectionnez Somme, et dans Colonne, sélectionnez Unités.
  7. Sélectionnez OK.

Capture d’écran de la boîte de dialogue Regrouper par avec les colonnes agrégées renseignées.

Cette opération vous donne le tableau suivant.

Capture d’écran de l’exemple de tableau de sortie avec les colonnes Country, Sales Channel et Total units.

Opérations disponibles

Avec la fonctionnalité Grouper par fonctionnalité, les opérations disponibles peuvent être classées de deux manières :

  • Opération au niveau de la ligne
  • Opération au niveau des colonnes

Le tableau suivant décrit chacune de ces opérations.

Nom de l’opération Catégorie Descriptif
Somme Opération de colonne Additionne toutes les valeurs d’une colonne
Moyenne Opérations sur les colonnes Calcule la valeur moyenne d’une colonne
Median Opération de colonne Calcule la médiane à partir d’une colonne
Min Opération de colonne Calcule la valeur minimale d’une colonne
Max Opération de colonne Calcule la valeur maximale d’une colonne
Percentile Opération de colonne Calcule le centile, à l’aide d’une valeur d’entrée comprise entre 0 et 100, à partir d’une colonne
Compter des valeurs distinctes Opération de colonne Calcule le nombre de valeurs distinctes d’une colonne
Compter les lignes Opération de ligne Calcule le nombre total de lignes d’un groupe donné
Compter le nombre de lignes distinctes Opération sur les lignes Calcule le nombre de lignes distinctes d’un groupe donné
Toutes les lignes Opération de ligne Génère toutes les lignes groupées dans une valeur de table sans agrégation

Note

Les opérations de comptage des valeurs distinctes et de percentile ne sont disponibles que dans Power Query Online.

Réaliser une opération de regroupement par une ou plusieurs colonnes

À partir de l’exemple d’origine, dans cet exemple, vous créez une colonne contenant les unités totales et deux autres colonnes qui vous donnent le nom et les unités vendues pour le produit le plus performant, résumées au niveau du pays et du canal de vente.

Capture d’écran de l’exemple de table de sortie avec des opérations.

  1. Utilisez les colonnes suivantes comme colonnes de grouper par :

    • Pays
    • Canal de vente
  2. Créez deux nouvelles colonnes en procédant comme suit :

    1. Agréger la colonne Unités à l’aide de l’opération Somme . Nommez cette colonne Nombre total d’unités.
    2. Ajoutez une nouvelle colonne Products à l’aide de l’opération Toutes les lignes .

    Capture d’écran de la boîte de dialogue Regrouper par avec une colonne non agrégée.

Une fois cette opération terminée, notez comment la colonne Products a des valeurs [Table] à l’intérieur de chaque cellule. Chaque valeur [Table] contient toutes les lignes qui ont été regroupées par les colonnes Country et Sales Channel de votre table d’origine. Vous pouvez sélectionner l’espace blanc à l’intérieur de la cellule pour afficher un aperçu du contenu du tableau en bas de la boîte de dialogue.

Capture d’écran du volet d’aperçu des détails du tableau.

Note

Le volet d’aperçu des détails peut ne pas afficher toutes les lignes utilisées pour l’opération group-by. Vous pouvez sélectionner la valeur [Table] pour afficher toutes les lignes relatives à l’opération de groupe correspondante.

Ensuite, vous devez extraire la ligne qui a la valeur la plus élevée dans la colonne Units des tableaux associés à la nouvelle colonne Products, et appeler cette nouvelle colonne Produit le plus performant.

Extraire les informations du produit le plus performant

Avec la nouvelle colonne Products avec des valeurs [Table], vous créez une colonne personnalisée en accédant à l’onglet Ajouter une colonne dans le ruban et en sélectionnant Colonne personnalisée dans le groupe Général .

Capture d’écran du ruban Power Query avec l’option Colonne personnalisée mise en évidence dans l’onglet Ajouter une colonne.

Nommez votre nouvelle colonne Produit performant. Entrez la formule Table.Max([Products], "Units" ) sous Formule de colonne personnalisée.

Capture d’écran de la boîte de dialogue Colonne personnalisée avec la formule de Table.Max entrée.

Le résultat de cette formule crée une colonne avec des valeurs [Record]. Ces valeurs d’enregistrement sont essentiellement une table avec une seule ligne. Ces enregistrements contiennent la ligne avec la valeur maximale de la colonne Unités de chaque valeur [Table] dans la colonne Products .

Capture d’écran du résultat de la formule de colonne personnalisée avec Table.Max.

Avec cette nouvelle colonne de produit « Top performeur  » qui contient des valeurs [Record], vous pouvez sélectionner l’icône développer, sélectionner les champs Product et Units , puis sélectionner OK.

Capture d’écran de l’opération de développement de la valeur d’enregistrement dans la colonne produit

Après avoir supprimé votre colonne Products et défini les types de données pour les deux colonnes nouvellement développées, votre résultat ressemble à l’image suivante.

Capture d’écran du tableau final avec toutes les transformations.

Regroupement flou

Note

La fonctionnalité suivante est disponible uniquement dans Power Query Online.

Pour montrer comment effectuer un « regroupement flou », considérez l’exemple de tableau illustré dans l’image suivante.

Capture d’écran d’une table avec neuf lignes d’entrées qui contiennent diverses orthographes et majuscules du nom Miguel et William.

L’objectif du regroupement flou est de réaliser une opération de regroupement qui utilise un algorithme de correspondance approximative pour les chaînes de texte. Power Query utilise l’algorithme de similarité Jaccard pour mesurer la similarité entre les paires d’instances. Ensuite, il applique un clustering hiérarchique agglomératif pour regrouper des instances. L’image suivante montre la sortie attendue, où la table est regroupée par la colonne Person .

Capture d’écran d’un tableau montrant les entrées Personne comme Miguel et Mike, et Fréquence comme 3 et 2, respectivement.

Pour effectuer le regroupement flou, vous effectuez les mêmes étapes décrites précédemment dans cet article. La seule différence est que cette fois, dans la boîte de dialogue Grouper par boîte de dialogue, vous activez la case à cocher Utiliser le regroupement flou .

Capture d’écran de la case à cocher Groupe flou mise en évidence dans la boîte de dialogue Grouper par.

Pour chaque groupe de lignes, Power Query choisit l’instance la plus fréquente comme instance « canonique ». Si plusieurs instances se produisent avec la même fréquence, Power Query sélectionne la première. Après avoir sélectionné OK dans la boîte de dialogue Grouper par , vous obtenez le résultat attendu.

Capture d’écran de l’exemple de tableau final de regroupement flou, sans table de transformation.

Toutefois, vous avez plus de contrôle sur l’opération de regroupement floue en développant les options de groupe approximatives.

Capture d’écran de la boîte de dialogue Grouper par dialogue avec les options de groupe floues mises en évidence.

Les options suivantes sont disponibles pour le regroupement flou :

  • Seuil de similarité (facultatif) : cette option indique comment les deux valeurs similaires doivent être regroupées. Le paramètre minimal de zéro (0) entraîne le regroupement de toutes les valeurs. Le paramètre maximal de 1 autorise uniquement les valeurs qui correspondent exactement à être regroupées. La valeur par défaut est 0.8.
  • Ignorer la casse : lorsque des chaînes de texte sont comparées, la casse est ignorée. Cette option est activée par défaut.
  • Regrouper en combinant des parties de texte : l’algorithme tente de combiner des parties de texte (telles que la combinaison de Micro et soft dans Microsoft) pour regrouper les valeurs.
  • Afficher les scores de similarité : afficher les scores de similarité entre les valeurs d’entrée et les valeurs représentatives calculées après le regroupement flou. Nécessite l’ajout d’une opération telle que Toutes les lignes pour présenter ces informations au niveau d’une ligne par ligne.
  • Table de transformation (facultatif) : vous pouvez sélectionner une table de transformation qui mappe des valeurs (par exemple , mapper MSFT à Microsoft) pour les regrouper.

Pour cet exemple, une table de transformation est utilisée pour montrer comment les valeurs peuvent être mappées. La table de transformation comporte deux colonnes :

  • De : chaîne de texte à rechercher dans votre tableau.
  • À : chaîne de texte à utiliser pour remplacer la chaîne de texte dans la colonne From .

L’image suivante montre la table de transformation utilisée dans cet exemple.

Capture d’écran du tableau montrant Les valeurs from mike et William, and To values of Miguel and Bill.

Important

Il est important que la table de transformation ait les mêmes colonnes et noms de colonnes que ceux indiqués dans l’image précédente (ils doivent être étiquetés « From » et « To »). Sinon, Power Query ne reconnaît pas la table en tant que table de transformation.

Revenez à la boîte de dialogue Regrouper par, développez les options de regroupement flou, changez l'opération de compter les lignes en toutes les lignes, activez l'option Afficher les scores de similarité, puis sélectionnez le menu déroulant Table de transformation.

Capture d’écran du menu déroulant de l’exemple de tableau de transformation de regroupement flou.

Après avoir sélectionné la table de transformation, sélectionnez OK. Le résultat de cette opération vous donne les informations suivantes :

Capture d’écran de l’exemple de tableau final de regroupement flou avec la table de transformation.

Dans cet exemple, l'option Ignorer la casse a été activée, donc les valeurs de la colonne From de la table de transformation sont utilisées pour rechercher la chaîne de texte sans tenir compte de la casse de la chaîne. Cette opération de transformation se produit en premier, puis l’opération de regroupement approximative est effectuée.

Le score de similarité est également indiqué dans la valeur du tableau, à côté de la colonne 'personne', ce qui reflète exactement la façon dont les valeurs ont été regroupées et leurs scores de similarité respectifs. Vous pouvez développer cette colonne si nécessaire ou utiliser les valeurs des nouvelles colonnes De fréquence pour d’autres types de transformations.

Note

Lors du regroupement par plusieurs colonnes, la table de transformation effectue l’opération de remplacement dans toutes les colonnes si le remplacement de la valeur augmente le score de similarité.

Pour plus d’informations sur le fonctionnement des tables de transformation, accédez aux précepts de la table de transformation.