Partager via


Exploration d'un modèle d'exploration de données Règles d'association

Lorsque vous ouvrez un modèle d’association à l’aide de Parcourir, le modèle s’affiche dans une visionneuse interactive, semblable à la visionneuse de règles d’association dans Analysis Services. La visionneuse vous permet de voir d'un seul coup d'œil les éléments corrélés les uns aux autres, et d'afficher les règles que vous pouvez utiliser pour la prédiction ou pour formuler des recommandations.

Explorer le modèle

Lorsque vous ouvrez un modèle d’exploration de données créé à l’aide de l’algorithme Règles d’association Microsoft, la fenêtre Parcourir inclut les vues suivantes, chacune conçue pour vous permettre d’explorer un aspect différent du modèle :

Notez l’option sur chaque onglet , Afficher le nom long . En sélectionnant cette option, vous pouvez afficher ou masquer la table d'origine du jeu d'éléments, et raccourcir ou développer le nom de la règle ou du jeu d'éléments. Cette option est particulièrement utile lorsque vos données de cas et vos données d'attribut sont issues de sources de données différentes.

Pour tester avec un modèle d'association, utilisez l'exemple de données de l'onglet Association du classeur d'exemple, et créez un modèle d'association à l'aide de toutes les valeurs par défaut. Vous pouvez également créer un modèle Analyse du panier d’achat et l’ouvrir à l’aide de Parcourir.

Jeux d'éléments

L’onglet Ensembles d’éléments est un bon endroit pour commencer à explorer un modèle d’association. Il affiche la liste des éléments que le modèle a identifiés comme apparaissant fréquemment ensemble.

Liste d’éléments dans un modèle d’association

Un exemple habituel de jeux d'éléments est un modèle de panier d'achat où un jeu d'éléments représente des paires ou des ensembles de produits que les clients achètent souvent en même temps. Toutefois, selon la façon dont vous regroupez et commandez vos éléments, l’ensemble d’éléments peut contenir une séquence de films que les clients commandent sur une période donnée, ou des événements qui ont tendance à se produire dans un emplacement particulier.

Un ensemble d’éléments peut contenir aussi peu d’un élément à deux, trois, ou plusieurs sont définis comme taille maximale du jeu d’éléments pour le modèle. Pour chaque ensemble d’éléments, la visionneuse affiche la prise en charge, la probabilité et la taille de l’ensemble d’éléments. Le support et la probabilité sont les statistiques principales utilisées pour classer les jeux d'éléments et les règles générées par un modèle d'association. Ces valeurs sont également utilisées pour calculer et décrire leur importance.

Support. La prise en charge désigne le nombre maximal de cas ou de lignes de données d'entrée de cet élément. Par exemple, si un ensemble d’éléments contient deux éléments qui se trouvent dans un panier d’achat, le nombre dans la colonne Support indique le nombre de fois que cette combinaison d’éléments s’est produite dans les données sources.

Taille. En modifiant la taille d'un jeu d'éléments, vous contrôlez la longueur de la liste d'éléments. Si vous ne souhaitez pas voir un seul produit dans la liste, remplacez l’option Taille minimale de l’ensemble d’éléments par 2 ou plus. La restriction de la liste en augmentant la taille minimale des jeux d'éléments vous permet de rechercher des séquences très spécifiques. Cela peut être utile si vous utilisez un jeu de données de grande taille.

Vous pouvez filtrer le nombre d’ensembles d’éléments affichés dans l’onglet en modifiant les valeurs De support minimal et Maximum de lignes . Si vous augmentez la valeur Support minimal , la liste affiche moins d’ensembles d’éléments, mais les ensembles d’éléments sont les plus courants dans les données d’entrée. La question de savoir si commun est identique à important est une autre question, que vous pouvez explorer à l’aide de l’onglet Règles .

Notez que la modification de la valeur de prise en charge ou d’autres contrôles sous l’onglet Ensembles d’éléments modifie uniquement les éléments affichés et n’affecte pas le modèle sous-jacent. Si vous souhaitez générer moins ou plus d’ensembles d’éléments, ou limiter leur taille, vous devez utiliser les paramètres MINIMUM_SUPPORT et MAXIMUM_SUPPORT, disponibles dans la boîte de dialogue Paramètres de l’algorithme .

Explorer la liste de jeux d'éléments
  1. Cliquez sur la colonne Support pour trier la prise en charge la plus élevée à la plus faible. Cela vous donnera une idée de ce que les clients achètent le plus souvent.

  2. Pour vous concentrer sur un ensemble d’éléments particulier intéressant, parmi les milliers de combinaisons possibles, tapez du texte dans la zone Filtrer l’ensemble d’éléments .

    Ici, nous avons tapé Gloves. Lorsque vous appliquez le filtre, la liste est actualisée pour afficher uniquement les éléments contenant des gants. Cela vous permet de vous concentrer sur les transactions où les clients ont acheté des gants et d'autres éléments.

    L'option Filtrer le jeu d'éléments affiche également une liste des filtres que vous avez utilisés précédemment.

  3. Modifiez la valeur de Taille minimale de l’ensemble d’éléments pour filtrer les clients qui ont acheté uniquement des gants et aucun autre élément.

  4. Cliquez sur la liste déroulante de l’option Afficher pour contrôler l’affichage des attributs :

    • Afficher le nom et la valeur de l'attribut

    • Afficher la valeur de l'attribut uniquement

    • Afficher le nom de l'attribut uniquement

    Notez comment les noms changent. Dans le cas d'un modèle de panier d'achat, créé à partir de tables imbriquées de produits achetés par plusieurs clients, le nom de l'attribut est généralement le nom du produit, et la présence du produit dans la liste est signalée comme Existing, indiquant que le client les a achetés.

    L'opposé de Existing est Missing, qui est un attribut très utile pour approfondir l'exploration des données. Par exemple, supposons que l’ensemble d’éléments A +B soit si populaire que vous vouliez trouver des clients qui ont acheté l’article A, mais pas l’article B. Pour ce faire, vous pouvez utiliser une requête de prédiction et récupérer les transactions avec l’une, mais pas l’autre, et effectuer une analyse plus approfondie sur celles-ci. Pour plus d’informations sur la création de requêtes de prédiction sur des modèles d’association, consultez Exemples de requêtes de modèle d’association dans SQL Server documentation en ligne

  5. Pour forcer la réécriture de la liste des jeux d’éléments à l’aide de vos nouveaux critères de filtre, vous pouvez sélectionner ou décocher la zone Afficher le nom long case activée.

Retour en haut

Règles

L’onglet Règles combine des informations sur les jeux d’éléments et leur valeur relative.

Liste des règles créées par un modèle d’association

La probabilité représente la fraction des cas dans le jeu de données qui contiennent la combinaison ciblée d’éléments. La probabilité est similaire au concept statistique de confiance et vous donne une indication de la probabilité que le résultat d’une règle se produise. Vous pouvez modifier la valeur de Probabilité minimale dans ce volet pour filtrer les règles affichées.

La valeur de probabilité minimale que vous voyez initialement correspond à la valeur de seuil utilisée par l’algorithme lors de la génération du modèle. Une fois le modèle terminé, vous ne pouvez pas diminuer cette valeur, mais vous pouvez l’augmenter pour afficher uniquement les éléments de probabilité les plus élevés.

L’importance est conçue pour mesurer l’utilité d’une règle. Une règle très courante peut être si omniprésente qu'elle n'a qu'une valeur d'information minime. Plus l'importance est élevée, plus la règle est utile pour prédire le résultat. Dans l’outil Analyse du panier d’achat (Analyse des tablesTools pour Excel), l’importance peut être combinée avec le prix des articles pour déterminer les offres groupées potentiellement les plus précieuses en termes de ventes.

Explorer la liste de règles
  1. Essayez de cliquer sur les en-têtes de colonne Probabilité,Importance et Règle pour voir comment les données changent.

  2. Utilisez l’option Règle de filtre pour taper des valeurs et vous concentrer sur les règles ciblées.

    Par exemple, si vous souhaitez voir toutes les règles qui prédisent ce que les clients sont susceptibles d’acheter avec des gants, tapez « gants » dans la zone de texte et actualisez le volet.

    L'option Filtrer le jeu d'éléments affiche également une liste des filtres que vous avez utilisés précédemment.

  3. Pour forcer la réaffichement de la liste des règles à l’aide de critères de filtre, vous pouvez sélectionner ou décocher la zone Afficher le nom long case activée.

  4. Utilisez l’option Afficher pour contrôler la façon dont les noms de règle sont affichés.

  5. Définissez la valeur de l’option Nombre maximal de lignes sur 100, puis cliquez sur Copier dans Excel.

    Notez que la modification de cette valeur n’a aucun effet sur la quantité de données dans le modèle ; il contrôle simplement le nombre de lignes dans la liste d’affichage. Cette option est utile si vous travaillez sur de très grands modèles.

Retour en haut

Réseau de dépendances

L’onglet Réseau de dépendances est une carte visuelle des corrélations entre les éléments. Chaque ovale dans le graphe (appelé nœud) représente une paire attribut-valeur, telle que « Vest = Existing » ou « Age = 1-30 ». Chaque ligne reliant les ovales (appelée arête) représente un type de corrélation.

Graphe réseau de dépendance pour un modèle d’association

Explorer le réseau de dépendances
  1. Cliquez sur le bouton Rechercher et utilisez la boîte de dialogue Rechercher un nœud pour taper un élément qui vous intéresse.

    Par exemple, tapez « gants », puis agrandissez le graphique dans la fenêtre afin que vous puissiez facilement voir les résultats.

    Le nœud qui contient les éléments est mis en surbrillance tandis que les flèches qui pointent sur le nœud représentent les règles qui relient les éléments.

    La direction de la flèche indique la direction de la règle. Par exemple, si une personne qui achète des gants est également susceptible d’acheter un gilet, la flèche commence à partir du nœud « gant » et se termine sur le nœud « gilet ».

    Pour obtenir des statistiques supplémentaires sur cette règle, vous pouvez cliquer sur l’onglet Règles et rechercher une règle avec la description « Glove - Existing » -> « Vest - Existing. »)

  2. Cliquez sur le curseur à gauche de la visionneuse et faites-le glisser.

    Le curseur sert à filtrer en fonction de la probabilité des règles. Le déplacement du curseur vers le bas affiche uniquement les règles les plus fortes.

  3. Cliquez sur Copier dans Excel pour copier un instantané de la fenêtre active dans Excel.

    Vous ne pourrez pas utiliser le graphique que vous copiez dans Excel ; Si vous avez besoin d’un graphe réseau interactif, utilisez l’option Affichage des modèles d’exploration de données dans Visio (compléments d’exploration de données).

Retour en haut

Pour plus d'informations sur les modèles d'association

Vous pouvez utiliser la fonctionnalité Parcourir pour ouvrir et explorer n’importe quel modèle créé à l’aide de l’algorithme Règles d’association Microsoft. Cela inclut les modèles créés à l’aide de l’outil Analyse du panier d’achat (Table AnalysisTools for Excel), dans le ruban Outils d’analyse de table ou dans Analysis Services.

Si vous créez un modèle de règles d'association à l'aide de l'outil Analyse du panier d'achat, de nombreuses options avancées sont configurées automatiquement.

Si vous souhaitez définir des paramètres avancés ou modifier la probabilité et la prise en charge minimales, utilisez l’Assistant Associé (Client d’exploration de données pour Excel) ou créez votre propre modèle à l’aide de l’option de modélisation Ajouter un modèle à la structure (compléments d’exploration de données pour Excel).

  • Ensembles d’éléments : Lorsque vous créez le modèle, vous pouvez également contrôler le nombre d’ensembles d’éléments générés en affectant une valeur au paramètre MINIMUM_PROBABILITY. Ce paramètre est disponible dans la Boîte de dialogue Paramètres d'algorithme.

  • Règles: L’algorithme Règles d’association Microsoft utilise des valeurs de probabilité pour limiter le nombre de règles générées. Vous pouvez contrôler le nombre de règles en définissant les paramètres MINIMUM_PROBABILITY ou MINIMUM _IMPORTANCE.

Pour plus d’informations sur la configuration des paramètres avancés, consultez Algorithmes d’exploration de données (SQL Server compléments d’exploration de données).

Voir aussi

Exploration des modèles dans Excel (Compléments d'exploration de données SQL Server)