Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
L’algorithme Microsoft Association est un algorithme d’association fourni par Analysis Services qui est utile pour les moteurs de recommandation. Un moteur de recommandation recommande des produits aux clients en fonction des articles qu’ils ont déjà achetés ou dans lesquels ils ont indiqué un intérêt. L’algorithme Microsoft Association est également utile pour l’analyse du panier de marché. Pour obtenir un exemple d’analyse du panier de marché, consultez la leçon 3 : Création d’un scénario de panier de marché (didacticiel sur l’exploration de données intermédiaire) dans le didacticiel sur l’exploration de données.
Les modèles d’association sont basés sur des jeux de données qui contiennent des identificateurs à la fois pour des cas individuels et pour les éléments que les cas contiennent. Un groupe d’éléments dans un cas est appelé ensemble d’éléments. Un modèle d’association se compose d’une série d’ensembles d’éléments et des règles qui décrivent comment ces éléments sont regroupés dans les cas. Les règles que l’algorithme identifie peuvent être utilisées pour prédire les achats futurs probables d’un client, en fonction des éléments qui existent déjà dans le panier d’achat du client. Le diagramme suivant montre une série de règles dans un ensemble d’éléments.
Comme le montre le diagramme, l’algorithme Microsoft Association peut potentiellement trouver de nombreuses règles dans un jeu de données. L’algorithme utilise deux paramètres, la prise en charge et la probabilité, pour décrire les ensembles d’éléments et les règles qu’il génère. Par exemple, si X et Y représentent deux éléments qui peuvent se trouver dans un panier d’achat, le paramètre de prise en charge est le nombre de cas dans le jeu de données qui contiennent la combinaison d’éléments, X et Y. En utilisant le paramètre de prise en charge en combinaison avec les paramètres définis par l’utilisateur, MINIMUM_SUPPORT et MAXIMUM_SUPPORT, l’algorithme contrôle le nombre d’ensembles d’éléments générés. Le paramètre de probabilité, également nommé confiance, représente la fraction des cas dans le jeu de données qui contiennent X et qui contiennent également Y. En utilisant le paramètre de probabilité en combinaison avec le paramètre MINIMUM_PROBABILITY , l’algorithme contrôle le nombre de règles générées.
Exemple :
La société Adventure Works Cycle remanie les fonctionnalités de son site Web. L’objectif de la refonte est d’augmenter la vente de produits. Étant donné que la société enregistre chaque vente dans une base de données transactionnelle, elle peut utiliser l’algorithme Microsoft Association pour identifier les ensembles de produits qui ont tendance à être achetés ensemble. Ils peuvent ensuite prédire des articles supplémentaires auxquels un client peut s’intéresser, en fonction des articles qui se trouvent déjà dans le panier d’achat du client.
Fonctionnement de l’algorithme
L’algorithme Microsoft Association traverse un jeu de données pour rechercher des éléments qui apparaissent ensemble dans un cas. L’algorithme regroupe ensuite les ensembles d’éléments associés qui apparaissent, au minimum, dans le nombre de cas spécifiés par le paramètre MINIMUM_SUPPORT . Par exemple, un ensemble d’éléments peut être « Mountain 200=Existing, Sport 100=Existing » et peut avoir une prise en charge de 710. L’algorithme génère ensuite des règles à partir des ensembles d’éléments. Ces règles sont utilisées pour prédire la présence d’un élément dans la base de données, en fonction de la présence d’autres éléments spécifiques que l’algorithme identifie comme importants. Par exemple, une règle peut être « si Touring 1000=existant et porte-bidon de route=existant, bidon d'eau=existant » et peut avoir une probabilité de 0,812. Dans cet exemple, l’algorithme identifie que la présence dans le panier du pneu Touring 1000 et de la cage de bouteille d’eau prédit qu’une bouteille d’eau serait également dans le panier.
Pour obtenir une explication plus détaillée de l’algorithme, ainsi qu’une liste de paramètres pour personnaliser le comportement de l’algorithme et contrôler les résultats dans le modèle d’exploration de données, consultez Microsoft Association Algorithm Technical Reference.
Données requises pour les modèles d’association
Lorsque vous préparez des données à utiliser dans un modèle de règles d’association, vous devez comprendre les exigences de l’algorithme particulier, y compris la quantité de données nécessaires et la façon dont les données sont utilisées.
Les exigences d’un modèle de règles d’association sont les suivantes :
Une seule colonne clé Chaque modèle doit contenir une colonne numérique ou texte qui identifie de manière unique chaque enregistrement. clés composées non autorisées.
Une seule colonne prédictible Un modèle d’association ne peut avoir qu’une seule colonne prédictible. En règle générale, il s'agit de la colonne clé de la table imbriquée, comme le champ qui liste les produits achetés. Les valeurs doivent être discrètes ou discrétisées.
Colonnes d’entrée . Les colonnes d’entrée doivent être discrètes. Les données d’entrée d’un modèle d’association sont souvent contenues dans deux tables. Par exemple, une table peut contenir des informations client tandis qu’une autre table contient des achats clients. Vous pouvez entrer ces données dans le modèle à l’aide d’une table imbriquée. Pour plus d’informations sur les tables imbriquées, consultez Tables imbriquées (Analysis Services - Exploration de données).
Pour plus d’informations sur les types de contenu et les types de données pris en charge pour les modèles d’association, consultez la section Exigences de microsoft Association Algorithm Technical Reference.
Affichage d’un modèle d’association
Pour explorer le modèle, vous pouvez utiliser microsoft Association Viewer. Lorsque vous affichez un modèle d’association, Analysis Services présente les corrélations à partir de différents angles afin de mieux comprendre les relations et les règles qui ont été trouvées dans les données. Le volet Itemset de la visionneuse fournit une répartition détaillée des combinaisons les plus courantes ou des ensembles d’éléments. Le volet Règles présente une liste de règles qui ont été généralisées à partir des données, ajoute des calculs de probabilité et classe les règles par importance relative. la visionneuse du réseau de dépendances vous permet d’explorer visuellement la façon dont les différents éléments sont connectés. Pour plus d’informations, consultez Parcourir un modèle à l’aide de la visionneuse de cluster Microsoft.
Si vous souhaitez en savoir plus sur l’un des ensembles d’éléments et des règles, vous pouvez parcourir le modèle dans l’arborescence de contenu générique Microsoft. Le contenu stocké pour le modèle inclut la prise en charge de chaque ensemble d’éléments, un score pour chaque règle et d’autres statistiques. Pour plus d’informations, consultez Contenu du modèle d'extraction de données pour les modèles d’association (Analysis Services - Extraction de données).
Création de prédictions
Une fois le modèle traité, vous pouvez utiliser les règles et les ensembles d’éléments pour effectuer des prédictions. Dans un modèle d’association, une prédiction vous indique quel élément est susceptible de se produire en fonction de la présence de l’élément spécifié, et la prédiction peut inclure des informations telles que la probabilité, la prise en charge ou l’importance. Pour obtenir des exemples de création de requêtes sur un modèle d’association, consultez Exemples de requêtes de modèle d’association.
Pour obtenir des informations générales sur la création d’une requête sur un modèle d’exploration de données, consultez Requêtes d’exploration de données.
Performances
Le processus de création d’ensembles d’éléments et de compte des corrélations peut prendre du temps. Bien que l’algorithme Règles d’association Microsoft utilise des techniques d’optimisation pour économiser de l’espace et accélérer le traitement, vous devez savoir que les problèmes de performances peuvent se produire dans des conditions telles que les suivantes :
Le jeu de données est volumineux avec de nombreux éléments individuels.
La taille minimale de l’ensemble d’éléments est trop faible.
Pour réduire le temps de traitement et réduire la complexité des ensembles d’éléments, vous pouvez essayer de regrouper les éléments associés par catégories avant d’analyser les données.
Remarques
Ne prend pas en charge l’utilisation de PMML (Predictive Model Markup Language) pour la création de modèles d'exploration de données.
Prend en charge l’exploration détaillée.
Prend en charge l’utilisation de modèles d’exploration de données OLAP.
Prend en charge la création de dimensions d’exploration de données.
Voir aussi
Algorithmes d'extraction de données (Analysis Services - Exploration de données)Parcourir un modèle à l'aide de la Visionneuse des règles d'association MicrosoftContenu du modèle d'exploration pour les modèles d'association (Analysis Services - Exploration de données)Référence technique sur l'algorithme d'association MicrosoftExemples de requêtes pour les modèles d'association