Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Lorsque vous ouvrez un modèle de clustering à l’aide de Browse, le modèle s’affiche dans une visionneuse interactive, similaire à la visionneuse de clustering dans Analysis Services. La visionneuse vous aide à explorer les clusters qui ont été créés et à comprendre leurs caractéristiques. Vous pouvez également comparer et contraster des segments individuels avec d'autres segments ou avec la population.
Explorer le modèle
La fenêtre Parcourir inclut les outils suivants pour vous aider à comprendre votre modèle de clustering et à explorer les attributs des groupes de données sous-jacents :
Pour tester un modèle de clustering, vous pouvez utiliser les exemples de données sous l’onglet Formation de l’exemple de classeur de données et créer un modèle de clustering à l’aide de l’Assistant Cluster (Compléments d’exploration de données pour Excel) et de toutes les valeurs par défaut.
Diagramme de cluster
L’onglet Diagramme de cluster affiche tous les clusters qui se trouvent dans un modèle d’exploration de données. Ici, vous pouvez voir combien de regroupements différents ont été trouvés dans votre jeu de données, et comment ils sont proches ou éloignés les uns des autres.
Explorer le diagramme de cluster
Cliquez sur Cluster 1 dans le diagramme.
Notez comment les lignes grises connectant tous les clusters changent afin que les lignes menant au cluster sélectionné soient mises en surbrillance en bleu clair.
L’intensité de la ligne qui connecte un cluster à un autre représente la force de la similarité des clusters. Si l’ombrage est clair ou inexistant, les clusters ne sont pas très similaires. Lorsque la ligne devient plus sombre, elle indique que la similarité entre les deux clusters est plus forte.
Cliquez et faites glisser le curseur à gauche du diagramme de cluster pour ajuster le nombre de lignes affichés par la visionneuse.
Lorsque vous faites glisser le curseur vers le bas, seuls les liens les plus forts entre les clusters sont affichés. Cela vous aide à vous concentrer sur les groupes associés.
Notez le contrôle Shading Variable dans le coin supérieur droit de la fenêtre Diagramme de cluster .
Par défaut, elle est définie sur Population. Cela signifie que les clusters plus sombres ont une meilleure prise en charge.
Passer sur n’importe quel cluster avec le curseur.
Une info-bulle s'affiche, contenant la population de ce groupe.
À présent, cliquez sur la liste déroulante Variable de trame de fond et choisissez la variable Age . Comme vous le faites, une liste de valeurs apparaît dans la zone de texte État .
La colonne Age utilisée comme entrée dans ce modèle contient des valeurs numériques continues, mais à des fins de clustering, l’algorithme discrétise toujours les nombres. Ici, vous pouvez voir les compartiments ou les groupes créés par l’algorithme, tels que « Très Bas (<=27) » et « Très élevé (>=63) ».
Dans les listes déroulantes État , sélectionnez Très haut et découvrez comment le diagramme change.
En modifiant la variable d’ombrage, vous pouvez voir en un clin d’œil quels clusters contiennent davantage de ce groupe d’âge ciblé et quels clusters contiennent très peu de clients dans ce groupe d’âge.
Plus l’ombrage est foncé, plus la proportion de l’attribut cible et de la distribution des valeurs qui se regroupent est grande.
Recherchez le cluster le plus sombre lorsque la variable d'ombrage est définie sur 65 ans.
Placez la souris sur le cluster.
La valeur indiquée dans l’info-bulle montre maintenant la population de clients de ce cluster qui ont plus de 65 ans.
Cliquez avec le bouton droit sur le cluster, puis sélectionnez Renommer le cluster. Tapez un nouveau nom descriptif, tel que Plus de 65. Le nouveau nom est enregistré avec le modèle sur le serveur et peut être utilisé pour identifier le cluster dans les autres vues de clustering.
Profils de cluster
L’onglet Profils de cluster vous permet de comparer la composition de tous les clusters en un clin d’œil. Il s’agit d’un bon point de départ lorsque vous vous familiarisez avec le modèle. Cette vue est également utile ultérieurement, si vous explorez un cluster particulier et décidez que vous devez trouver des éléments connexes.
Les profils de cluster vous donnent également une bonne vue d’ensemble de la façon dont les clusters sont différents les uns des autres. Par conséquent, vous pouvez trouver pratique d’utiliser cette vue pour donner à chaque cluster un nom descriptif.
Explorer les profils de cluster
Cliquez sur la cellule Occupations, dans la colonne États , pour afficher la liste de toutes les valeurs de l’occupation.
Déplacez maintenant le curseur sur Occupation dans les profils de cluster.
L’info-bulle affiche la distribution des professions dans ce cluster.
Notez que, dans certains clusters (comme celui du graphique), la liste des professions n’est pas complète et certaines professions sont remplacées par l’étiquette Other.
Cela est par conception, car il peut être difficile de dire la différence entre de nombreuses petites barres dans un histogramme. Par défaut, seules les barres d’importance la plus élevée sont conservées et les barres restantes sont regroupées dans un autre compartiment gris.
Pour modifier le nombre de barres visibles dans n’importe quel histogramme, utilisez l'option Barres d'histogramme.
Notez que la colonne Age est différente des autres. Cliquez sur le diamant dans le graphique utilisé pour représenter l’âge.
La colonne Age contenait uniquement des nombres continus. L’algorithme de clustering nécessite des valeurs discrètes. Il regroupe donc les valeurs numériques dans la colonne Age en un nombre limité de groupes d’âge, en fonction de la distribution des valeurs.
Cliquez sur l’un des diagrammes en diamant dans un profil de cluster.
Ces graphiques en diamants sont affichés uniquement lorsque les données sources utilisent des valeurs numériques continues. Les graphiques en diamants fournissent des statistiques descriptives utiles, notamment la moyenne et l’écart type pour cette valeur dans chaque cluster :
La ligne du graphique en diamant représente la plage de valeurs de l’attribut. Les valeurs sont également affichées dans la colonne États à gauche du graphique Profils .
Le centre du diamant est positionné au niveau de la moyenne pour le nœud.
La largeur du diamant représente la variance de l’attribut à ce nœud. Par conséquent, un diamant plus mince indique que le nœud peut créer une prédiction plus précise.
Pour rendre plus de place dans le graphique, cliquez avec le bouton droit sur un cluster que vous n’avez pas besoin d’afficher immédiatement, puis sélectionnez Masquer la colonne. Cela ne le supprime pas du modèle, mais replie temporairement la colonne.
Pour afficher les clusters que vous avez masqués, vous pouvez cliquer et faire glisser le bord de la colonne, ou sélectionner le nom du cluster dans la liste, Autres clusters.
Faites défiler la liste des attributs jusqu’à ce que vous trouviez Bike Buyer, puis recherchez le cluster qui a le pourcentage le plus élevé de valeurs Oui.
Cliquez avec le bouton droit sur l’en-tête de colonne du cluster que vous souhaitez renommer, sélectionnez Renommer le cluster et tapez Bike Buyers.
Le nouveau nom du cluster est conservé dans toutes les vues et sur le serveur jusqu’à ce que vous retraitez le modèle.
Conseils
Cliquez sur un en-tête de colonne pour trier les attributs dans l’ordre d’importance de ce cluster.
Faites glisser des colonnes pour les réorganiser dans la visionneuse.
Cliquez sur n’importe quelle cellule du graphique de profils pour afficher des statistiques détaillées dans la Légende du Minage.
Faites un clic droit sur n’importe quelle cellule et sélectionnez colonnes de modèle Drillthrough pour générer les données sous-jacentes dans une nouvelle feuille de calcul Excel.
Cliquez avec le bouton droit sur l’en-tête de colonne du cluster et sélectionnez Extraction pour structurer les données pour obtenir des informations détaillées sur les membres du cluster qui n’ont pas été inclus dans le modèle.
Par exemple, si vous profilez des clients, vous pouvez laisser les informations de contact dans les données sous-jacentes (la structure d’exploration de données) mais pas l’inclure dans le modèle, car elle n’est pas utile pour l’analyse. Toutefois, une fois que les clients ont été affectés à des clusters, vous pouvez afficher les données détaillées par exploration détaillée.
Caractéristiques du cluster
La vue Caractéristiques du cluster vous permet d’explorer réellement un seul cluster pour trouver les attributs les plus fortement caractérisent ce groupe de données.
Explorer les caractéristiques du cluster
Sélectionnez le cluster Plus de 65 dans la liste des clusters .
Après avoir sélectionné un cluster, vous pouvez voir en détail les caractéristiques qui composent ce cluster spécifique.
Les attributs que contient le cluster sont répertoriés dans les colonnes Variables et l’état de l’attribut répertorié est répertorié dans la colonne Valeurs .
Les états d’attribut sont répertoriés dans l’ordre d’importance, accompagnés de leur probabilité dans ce cluster, représentés sous forme de barre colorée dans la colonne Probabilité .
Cliquez sur la colonne Variables pour trier par attribut.
En modifiant la variable de tri, vous pouvez voir plus facilement comment les valeurs des variables telles que le revenu ou la propriété de voiture sont distribuées dans le groupe.
Cliquez sur Copier dans Excel.
Une nouvelle feuille de calcul est ajoutée à votre classeur qui contient les caractéristiques du cluster sélectionné.
Choisissez maintenant un autre cluster dans la liste, Bike Buyers.
Cliquez sur Copier dans Excel.
Notez que le nouveau graphique des caractéristiques du cluster est ajouté sur sa propre feuille de calcul. Vous pouvez le déplacer dans la même feuille de calcul que l’autre profil pour faciliter leur comparaison, que vous effectuerez à l’étape suivante.
Conseils
Notez que la principale caractéristique du client dans le cluster Over 65 est qu’il n’achète pas votre produit ! Si vous souhaitez savoir pourquoi c’est le cas, vous pouvez parcourir des clusters et comparer des groupes, ou vous pouvez créer un modèle associé à l’aide d’un algorithme qui convient à l’exploration des causes et des résultats, tels qu’un modèle d’arbre de décision ou un modèle Naïve Bayes.
Si vous souhaitez obtenir une liste complète d’attributs et de probabilités pour ce cluster (ou tous les clusters), vous pouvez créer une requête. Pour obtenir des exemples de requêtes sur des modèles de clustering, consultez Exemples de requêtes de modèle de clustering.
Discrimination des clusters
Vous utilisez l’onglet Discrimination de cluster pour comparer les attributs entre deux clusters ou entre un cluster et tous les autres cas dans le jeu de données.
Pour mettre en évidence les fonctionnalités de cette visionneuse, nous allons la comparer aux tableaux côte à côte dans Excel que vous avez créés en fonction de la vue Caractéristiques du cluster .
Explorer la discrimination entre regroupements
Utilisez les listes Cluster 1 et Cluster 2 pour sélectionner les clusters à comparer.
Pour cluster 1, sélectionnez Plus de 65.
Pour le cluster 2, sélectionnez Acheteurs de vélos.
La comparaison doit ressembler au graphique suivant.
Notez que, en coulisses, le visualiseur Discrimination de Cluster envoie des requêtes complexes au serveur de data mining pour extraire les attributs les plus pertinents différenciant les deux groupes, ce qui rend plus aisée la comparaison de ces ensembles de clients.
Cliquez sur l’une des colonnes Favoris...
La barre à droite de l’attribut et de la liste des valeurs indique quelles caractéristiques ou valeurs sont les plus importantes en tant que caractéristiques du cluster sélectionné.
Comparez maintenant les listes dans Excel.
Étant donné que les statistiques sous-jacentes utilisées pour générer l’image dans la visionneuse sont enregistrées dans Excel sous forme de tableaux, vous pouvez filtrer et trier, et afficher les valeurs de probabilité réelles.
Outre l’utilisation d’Excel, nous vous recommandons d’essayer la visionneuse de cluster pour Visio, ce qui vous permet également d’afficher non seulement les points de données, mais également de modifier et d’améliorer largement le graphique. Pour plus d’informations, consultez La procédure pas à pas du diagramme de cluster (compléments d’exploration de données).
Conseils
Après avoir obtenu des insights sur des groupes de clients, essayez d’utiliser les outils What-If Scenario (Table Analysis Tools for Excel) ou Goal Seek Scenario (Outils d’analyse de tableau pour Excel), pour explorer les facteurs du modèle susceptibles d’être modifiés pour affecter le résultat.
Voir aussi
Modèles de navigation dans Excel (compléments d’exploration de données SQL Server)
Assistant de Clustering (Compléments d’exploration de données pour Excel)