Partager via


Mettre en surbrillance les exceptions (Outils d’analyse de tableau pour Excel)

Bouton Mettre en surbrillance les exceptions dans le ruban

Parfois, vos données peuvent contenir des valeurs particulières. Par exemple, l’âge d’un propriétaire peut être indiqué à cinq ans. Ces valeurs, souvent appelées hors norme, peuvent être incorrectes en raison d’une erreur d’entrée de données, ou elles peuvent indiquer des tendances inhabituelles. Dans les deux cas, les exceptions peuvent affecter la qualité de votre analyse. L’outil Mettre en surbrillance les exceptions vous aide à trouver ces valeurs et à les examiner pour une action supplémentaire.

L’outil Mettre en surbrillance des exceptions peut fonctionner avec l’ensemble de la plage de données d’un tableau de données Excel, ou vous ne pouvez sélectionner que quelques colonnes. Vous pouvez également ajuster un seuil qui contrôle la variabilité des données pour trouver plus ou moins d’exceptions.

Lorsque l’outil termine son analyse, il crée une feuille de calcul qui contient un rapport récapitulatif du nombre de valeurs hors norme trouvées dans chacune des colonnes que vous avez analysées. L’outil met également en évidence les exceptions dans la table de données d’origine. Étant donné que l’outil analyse les tendances globales, il peut trouver que la plupart des valeurs d’une ligne sont normales et ne mettent en surbrillance qu’une seule cellule de cette ligne. Dans l’exemple de propriétaire ci-dessus, seule la colonne Âge peut être mise en surbrillance.

Vous pouvez également modifier la valeur du seuil d’exception dans le rapport de synthèse. Cette valeur indique la probabilité qu’une cellule particulière contienne une valeur anormale. Par conséquent, si vous augmentez la valeur, moins de valeurs seront mises en surbrillance comme valeurs hors norme. À l’inverse, lorsque vous diminuez la valeur, vous verrez plus de cellules en surbrillance.

Utilisation de l’outil Mettre en surbrillance les exceptions

  1. Ouvrez un tableau Excel, puis cliquez sur Mettre en surbrillance les exceptions.

  2. Spécifiez les colonnes à analyser.

  3. Cliquez sur Exécuter.

  4. Ouvrez la table> intitulée <Valeurs hors norme de la feuille de calcul pour afficher un résumé des valeurs hors norme trouvées.

  5. Pour modifier le nombre de surbrillances, cliquez sur les flèches haut et bas dans la ligne Seuil d’exception du rapport Surligner les exceptions.

Spécifications

Vous pouvez inclure des colonnes qui ne contiennent pas de valeurs incorrectes si ces valeurs contiennent des informations susceptibles d’être utiles pour prédire d’autres lignes. Toutefois, vous devez désélectionner des colonnes qui ont de nombreuses valeurs manquantes ou nulles.

Étant donné que toutes les colonnes sélectionnées sont utilisées pour créer un modèle général, vous devez éviter d’utiliser des colonnes d’entrée que vous savez avoir des informations médiocres, telles que les suivantes :

  • Colonnes qui contiennent des valeurs uniques telles que des ID.

  • Colonnes qui contiennent un pourcentage élevé de valeurs incorrectes.

  • Colonnes avec de nombreuses valeurs manquantes.

    Notez qu’il existe certains cas où il est utile d’inclure des colonnes d’entrée qui ont de nombreuses valeurs manquantes. Par exemple, si la valeur du champ d’adresse est toujours manquante lorsque le client achète par le biais d’un détaillant, l’algorithme d’exploration de données peut utiliser ces informations pour identifier d’autres clients similaires. Vous devez déterminer au cas par cas si les données sont manquantes par omission ou parce que l’état manquant est significatif.

  • Les colonnes qui ne sont pas susceptibles d’être utiles pour créer un modèle. Par exemple, une colonne qui a la même valeur dans chaque ligne n’ajoute aucune information utile dans la création de modèles.

Présentation du rapport sur les exceptions de mise en surbrillance

Lorsque vous cliquez sur Exécuter, l’outil effectue trois opérations :

  • Crée une structure d’exploration de données basée sur les données actuelles de la table.

  • Crée un modèle d’exploration de données à l’aide de l’algorithme Microsoft Clustering.

  • Crée une requête de prédiction basée sur les modèles pour déterminer si les valeurs de la feuille de calcul sont improbables.

La valeur initiale du seuil d’exception est toujours 75, ce qui signifie que l’algorithme calculé a une probabilité de 75% que les données mises en surbrillance ne sont pas incorrectes. L’outil définit automatiquement ce seuil pour la passe d’analyse initiale, mais vous pouvez modifier la valeur dans le rapport.

L’outil Mettre en surbrillance les exceptions met en surbrillance les cellules de la table de données d’origine suspecte. La mise en évidence en sombre signifie que la ligne requiert de l'attention. La mise en surbrillance vive signifie que la valeur dans cette cellule a été identifiée comme étant suspecte. Si vous modifiez le seuil des exceptions, les valeurs en surbrillance changent en conséquence.

Le graphique récapitulative affiche le nombre de cellules de chaque colonne qui étaient au-dessus du seuil d’exception.

Lorsque vous nettoyez ou examinez les données en préparation de l’exploration de données, vous pouvez également essayer les fonctionnalités d’exploration de données dans le client d’exploration de données pour Excel. Ce complément fournit des outils plus avancés pour vous aider à trouver des valeurs aberrantes, réétiqueter des données ou à afficher la distribution des données. Pour plus d’informations sur les outils d’exploration de données dans le client d’exploration de données pour Excel, consultez Exploration et nettoyage des données.

L’outil Mettre en surbrillance les exceptions utilise l’algorithme de clustering Microsoft. Un modèle de clustering détecte les groupes de lignes qui partagent des caractéristiques similaires. Le client d’exploration de données pour Excel fournit une fenêtre Parcourir qui utilise des graphiques et des profils caractéristiques pour vous permettre d’explorer les modèles d’exploration de données créés par le clustering. Pour plus d’informations sur la façon de parcourir le modèle de clustering créé par l’outil Mettre en surbrillance les exceptions , consultez Parcourir les modèles (Client d’exploration de données pour Excel) .

Pour plus d’informations sur l’algorithme Microsoft Clustering, consultez la rubrique « Algorithme de clustering Microsoft » dans la documentation en ligne de SQL Server.

Voir aussi

Outils d’analyse de tableau pour Excel