Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Dans Power Query, vous pouvez regrouper des valeurs dans différentes lignes en une seule valeur en regroupant les lignes en fonction des valeurs d’une ou plusieurs colonnes. Vous pouvez choisir parmi deux types d’opérations de regroupement :
Regroupements de colonnes.
Regroupements de lignes.
Pour ce tutoriel, vous utilisez l’exemple de tableau suivant.
Capture d’écran d’un tableau avec des colonnes montrant Année (2020), Pays (États-Unis, Panama ou Canada), Produit (Chemise ou Short), Canal de vente (En ligne ou Revendeur) et Unités (différentes valeurs comprises entre 55 et 7500)
Où trouver le bouton Grouper par
Vous pouvez trouver le bouton Grouper par trois emplacements :
Sous l’onglet Accueil , dans le groupe Transformer .
Sous l’onglet Transformation , dans le groupe Tableau .
Dans le menu contextuel, lorsque vous cliquez avec le bouton droit pour sélectionner des colonnes.
Utiliser une fonction d’agrégation pour regrouper par une ou plusieurs colonnes
Dans cet exemple, votre objectif est de résumer le total des unités vendues au niveau du pays et du canal de vente. Vous utilisez les colonnes Country et Sales Channel pour effectuer l'opération de regroupement.
- Sélectionnez Regrouper par sous l’onglet Accueil .
- Sélectionnez l’option Avancé pour pouvoir sélectionner plusieurs colonnes à regrouper.
- Sélectionnez la colonne Country .
- Sélectionnez Ajouter un regroupement.
- Sélectionnez la colonne Sales Channel .
- Dans Nouveau nom de colonne, entrez Unités totales, dans Opération, sélectionnez Somme, et dans Colonne, sélectionnez Unités.
- Sélectionnez OK.
Cette opération vous donne le tableau suivant.
Opérations disponibles
Avec la fonctionnalité Grouper par fonctionnalité, les opérations disponibles peuvent être classées de deux manières :
- Opération au niveau de la ligne
- Opération au niveau des colonnes
Le tableau suivant décrit chacune de ces opérations.
| Nom de l’opération | Catégorie | Descriptif |
|---|---|---|
| Somme | Opération de colonne | Additionne toutes les valeurs d’une colonne |
| Moyenne | Opérations sur les colonnes | Calcule la valeur moyenne d’une colonne |
| Median | Opération de colonne | Calcule la médiane à partir d’une colonne |
| Min | Opération de colonne | Calcule la valeur minimale d’une colonne |
| Max | Opération de colonne | Calcule la valeur maximale d’une colonne |
| Percentile | Opération de colonne | Calcule le centile, à l’aide d’une valeur d’entrée comprise entre 0 et 100, à partir d’une colonne |
| Compter des valeurs distinctes | Opération de colonne | Calcule le nombre de valeurs distinctes d’une colonne |
| Compter les lignes | Opération de ligne | Calcule le nombre total de lignes d’un groupe donné |
| Compter le nombre de lignes distinctes | Opération sur les lignes | Calcule le nombre de lignes distinctes d’un groupe donné |
| Toutes les lignes | Opération de ligne | Génère toutes les lignes groupées dans une valeur de table sans agrégation |
Note
Les opérations de comptage des valeurs distinctes et de percentile ne sont disponibles que dans Power Query Online.
Réaliser une opération de regroupement par une ou plusieurs colonnes
À partir de l’exemple d’origine, dans cet exemple, vous créez une colonne contenant les unités totales et deux autres colonnes qui vous donnent le nom et les unités vendues pour le produit le plus performant, résumées au niveau du pays et du canal de vente.
Utilisez les colonnes suivantes comme colonnes de grouper par :
- Pays
- Canal de vente
Créez deux nouvelles colonnes en procédant comme suit :
- Agréger la colonne Unités à l’aide de l’opération Somme . Nommez cette colonne Nombre total d’unités.
- Ajoutez une nouvelle colonne Products à l’aide de l’opération Toutes les lignes .
Une fois cette opération terminée, notez comment la colonne Products a des valeurs [Table] à l’intérieur de chaque cellule. Chaque valeur [Table] contient toutes les lignes qui ont été regroupées par les colonnes Country et Sales Channel de votre table d’origine. Vous pouvez sélectionner l’espace blanc à l’intérieur de la cellule pour afficher un aperçu du contenu du tableau en bas de la boîte de dialogue.
Note
Le volet d’aperçu des détails peut ne pas afficher toutes les lignes utilisées pour l’opération group-by. Vous pouvez sélectionner la valeur [Table] pour afficher toutes les lignes relatives à l’opération de groupe correspondante.
Ensuite, vous devez extraire la ligne qui a la valeur la plus élevée dans la colonne Units des tableaux associés à la nouvelle colonne Products, et appeler cette nouvelle colonne Produit le plus performant.
Extraire les informations du produit le plus performant
Avec la nouvelle colonne Products avec des valeurs [Table], vous créez une colonne personnalisée en accédant à l’onglet Ajouter une colonne dans le ruban et en sélectionnant Colonne personnalisée dans le groupe Général .
Nommez votre nouvelle colonne Produit performant. Entrez la formule Table.Max([Products], "Units" ) sous Formule de colonne personnalisée.
Le résultat de cette formule crée une colonne avec des valeurs [Record]. Ces valeurs d’enregistrement sont essentiellement une table avec une seule ligne. Ces enregistrements contiennent la ligne avec la valeur maximale de la colonne Unités de chaque valeur [Table] dans la colonne Products .
Avec cette nouvelle colonne de produit « Top performeur » qui contient des valeurs [Record], vous pouvez sélectionner l’icône
développer, sélectionner les champs Product et Units , puis sélectionner OK.
Après avoir supprimé votre colonne Products et défini les types de données pour les deux colonnes nouvellement développées, votre résultat ressemble à l’image suivante.
Regroupement flou
Note
La fonctionnalité suivante est disponible uniquement dans Power Query Online.
Pour montrer comment effectuer un « regroupement flou », considérez l’exemple de tableau illustré dans l’image suivante.
L’objectif du regroupement flou est de réaliser une opération de regroupement qui utilise un algorithme de correspondance approximative pour les chaînes de texte. Power Query utilise l’algorithme de similarité Jaccard pour mesurer la similarité entre les paires d’instances. Ensuite, il applique un clustering hiérarchique agglomératif pour regrouper des instances. L’image suivante montre la sortie attendue, où la table est regroupée par la colonne Person .
Pour effectuer le regroupement flou, vous effectuez les mêmes étapes décrites précédemment dans cet article. La seule différence est que cette fois, dans la boîte de dialogue Grouper par boîte de dialogue, vous activez la case à cocher Utiliser le regroupement flou .
Pour chaque groupe de lignes, Power Query choisit l’instance la plus fréquente comme instance « canonique ». Si plusieurs instances se produisent avec la même fréquence, Power Query sélectionne la première. Après avoir sélectionné OK dans la boîte de dialogue Grouper par , vous obtenez le résultat attendu.
Toutefois, vous avez plus de contrôle sur l’opération de regroupement floue en développant les options de groupe approximatives.
Les options suivantes sont disponibles pour le regroupement flou :
- Seuil de similarité (facultatif) : cette option indique comment les deux valeurs similaires doivent être regroupées. Le paramètre minimal de zéro (0) entraîne le regroupement de toutes les valeurs. Le paramètre maximal de 1 autorise uniquement les valeurs qui correspondent exactement à être regroupées. La valeur par défaut est 0.8.
- Ignorer la casse : lorsque des chaînes de texte sont comparées, la casse est ignorée. Cette option est activée par défaut.
- Regrouper en combinant des parties de texte : l’algorithme tente de combiner des parties de texte (telles que la combinaison de Micro et soft dans Microsoft) pour regrouper les valeurs.
- Afficher les scores de similarité : afficher les scores de similarité entre les valeurs d’entrée et les valeurs représentatives calculées après le regroupement flou. Nécessite l’ajout d’une opération telle que Toutes les lignes pour présenter ces informations au niveau d’une ligne par ligne.
- Table de transformation (facultatif) : vous pouvez sélectionner une table de transformation qui mappe des valeurs (par exemple , mapper MSFT à Microsoft) pour les regrouper.
Pour cet exemple, une table de transformation est utilisée pour montrer comment les valeurs peuvent être mappées. La table de transformation comporte deux colonnes :
- De : chaîne de texte à rechercher dans votre tableau.
- À : chaîne de texte à utiliser pour remplacer la chaîne de texte dans la colonne From .
L’image suivante montre la table de transformation utilisée dans cet exemple.
Important
Il est important que la table de transformation ait les mêmes colonnes et noms de colonnes que ceux indiqués dans l’image précédente (ils doivent être étiquetés « From » et « To »). Sinon, Power Query ne reconnaît pas la table en tant que table de transformation.
Revenez à la boîte de dialogue Regrouper par, développez les options de regroupement flou, changez l'opération de compter les lignes en toutes les lignes, activez l'option Afficher les scores de similarité, puis sélectionnez le menu déroulant Table de transformation.
Après avoir sélectionné la table de transformation, sélectionnez OK. Le résultat de cette opération vous donne les informations suivantes :
Dans cet exemple, l'option Ignorer la casse a été activée, donc les valeurs de la colonne From de la table de transformation sont utilisées pour rechercher la chaîne de texte sans tenir compte de la casse de la chaîne. Cette opération de transformation se produit en premier, puis l’opération de regroupement approximative est effectuée.
Le score de similarité est également indiqué dans la valeur du tableau, à côté de la colonne 'personne', ce qui reflète exactement la façon dont les valeurs ont été regroupées et leurs scores de similarité respectifs. Vous pouvez développer cette colonne si nécessaire ou utiliser les valeurs des nouvelles colonnes De fréquence pour d’autres types de transformations.
Note
Lors du regroupement par plusieurs colonnes, la table de transformation effectue l’opération de remplacement dans toutes les colonnes si le remplacement de la valeur augmente le score de similarité.
Pour plus d’informations sur le fonctionnement des tables de transformation, accédez aux précepts de la table de transformation.