Simplifier la structure des données
Lorsque vous importez des données depuis plusieurs sources dans Power BI Desktop, les données conservent leurs noms de table et de colonne prédéfinis. Vous pouvez changer certains de ces noms afin qu’ils soient dans un format cohérent, plus faciles à utiliser et plus parlants pour un utilisateur. Vous pouvez effectuer ces modifications de nom et simplifier votre structure de données à l’aide de l’Éditeur Power Query dans Power BI Desktop.
Pour poursuivre le scénario précédent où vous avez mis en forme les données initiales dans votre modèle, vous devez prendre des mesures supplémentaires pour simplifier la structure des données commerciales et les préparer au développement d’états pour l’équipe commerciale. Vous avez déjà renommé les colonnes, mais vous devez maintenant examiner les noms des requêtes (tables) pour déterminer si des améliorations peuvent y être apportées. Vous devez également examiner le contenu des colonnes et remplacer les valeurs nécessitant des corrections.
Renommer une requête
Il est recommandé de remplacer les noms de requête peu courants ou parlants par des noms plus évidents ou avec lesquels l’utilisateur est davantage familiarisé. Par exemple, si vous importez une table de faits de produit dans Power BI Desktop et que le nom de la requête s’affiche sous la forme FactProductTable, vous pouvez le remplacer par un nom plus convivial, par exemple Products. De même, si vous importez une vue, elle peut avoir un nom comportant le préfixe v, par exemple vProduct. Les utilisateurs peuvent trouver ce nom obscur et confus : il est donc préférable de supprimer le préfixe.
Dans cet exemple, vous avez examiné le nom de la requête TargetSales et vous avez réalisé que ce nom n’était d’aucune aide, car vous aurez une requête portant ce nom pour chaque année. Pour éviter toute confusion, vous souhaitez ajouter l’année au nom de la requête.
Dans l’Éditeur Power Query, sélectionnez la requête que vous souhaitez renommer dans le volet Requêtes à gauche de vos données. Cliquez avec le bouton droit sur la requête et sélectionnez Renommer. Modifiez le nom actuel ou tapez un nouveau nom, puis appuyez surEntrée.
Remplacer des valeurs
Vous pouvez remplacer toute valeur par une autre dans une colonne sélectionnée à l’aide de la fonctionnalité Remplacer les valeurs dans l’Éditeur Power Query.
Dans cet exemple, vous remarquez que le mois Décembre est mal orthographié dans la colonne Attribute. Vous devez corriger cette faute d’orthographe. Sélectionnez la colonne comportant la valeur à remplacer (Attribute dans ce cas), puis cliquez sur Remplacer les valeurs dans l’onglet Transformer.
Saisissez le nom de la valeur à remplacer dans la zone Valeur à rechercher et le nom de valeur correct dans la zone Remplacer par, puis cliquez sur OK. Dans Power Query, vous ne pouvez pas sélectionner une cellule et modifier une valeur, comme vous auriez pu le faire dans Excel.
Vous pouvez consulter la liste des étapes que vous avez suivies pour restructurer et corriger vos données dans le volet Paramètres de requête. Après avoir réalisé toutes les étapes souhaitées, vous pouvez cliquer sur Fermer et appliquer pour fermer l’Éditeur Power Query et appliquer vos modifications à votre modèle de données. Vous pouvez cependant effectuer d’autres actions pour nettoyer et transformer vos données.
Remplacer les valeurs nulles
Vous pouvez parfois constater que vos sources de données comportent des valeurs nulles. Par exemple, le montant des frais de transport sur une commande vente peut comporter une valeur nulle s’il est synonyme de zéro. Si la valeur reste nulle, les moyennes ne sont pas calculées correctement. Une solution serait de remplacer les valeurs nulles par zéro, ce qui produit une moyenne des frais de transport plus précise. Dans le cas présent, à l’aide des mêmes étapes que celles que vous avez suivies précédemment, vous pouvez remplacer les valeurs nulles par zéro.
Supprimer les doublons
Vous pouvez également supprimer les doublons des colonnes pour ne conserver que les noms uniques dans une colonne sélectionnée à l’aide de la fonctionnalité Supprimer les doublons de Power Query.
Dans cet exemple, notez que la colonne Category Name comporte des doublons pour chaque catégorie. Par conséquent, vous souhaitez créer une table avec des catégories uniques et l’utiliser dans votre modèle sémantique. Vous pouvez réaliser cette action en sélectionnant une colonne, en cliquant avec le bouton droit sur l’en-tête de la colonne, puis en sélectionnant l’option Supprimer les doublons.
Il peut être judicieux de copier la table avant de supprimer les doublons. L’option Copier se trouve en haut du menu contextuel, comme illustré dans la capture d’écran suivante. Copier la table avant de supprimer les doublons vous permet de comparer les tables et d’utiliser les deux tables si nécessaire.
Bonnes pratiques relatives à la dénomination des tables, des colonnes et des valeurs
Les conventions d’affectation de noms pour les tables, les colonnes et les valeurs n’ont pas de règle fixe ; nous vous recommandons cependant d’utiliser le langage et les abréviations couramment utilisés au sein de votre organisation, sur lesquels tout le monde s’accorde et que tout le monde considère comme terminologie commune.
Une bonne pratique consiste à donner aux tables, aux colonnes et aux mesures des termes métier descriptifs, et à remplacer les traits de soulignement (« _ ») par des espaces. Soyez cohérent avec les abréviations, les préfixes et des mots comme « numéro » et « ID ». Des abréviations trop courtes peuvent prêter à confusion si elles ne sont pas couramment utilisées au sein de l’organisation.
De plus, en supprimant les préfixes ou les suffixes que vous pouvez utiliser dans les noms de table et en les nommant selon un format simple, vous limitez les risques de confusion.
Lors du remplacement de valeurs, essayez d’imaginer comment ces valeurs vont s’afficher dans l’état. Les valeurs trop longues peuvent être difficiles à lire et insérer dans un visuel. Les valeurs trop courtes peuvent être difficiles à interpréter. Il est également judicieux d’éviter les acronymes dans les valeurs, à condition que le texte s’adapte au visuel.