Partager via


Leçon 2 : Ajout de modèles d’exploration de données à la structure d’exploration de données Bike Buyer

Dans cette leçon, vous allez ajouter deux modèles d’exploration de données à la structure d’exploration de données Bike Buyer que vous avez créée la leçon 1 : Création de la structure d’exploration de données Bike Buyer. Ces modèles d’exploration de données vous permettent d’explorer les données à l’aide d’un modèle et de créer des prédictions à l’aide d’une autre.

Pour explorer la façon dont les clients potentiels peuvent être classés par leurs caractéristiques, vous allez créer un modèle d’exploration de données basé sur l’algorithme de clustering Microsoft. Dans une leçon ultérieure, vous allez découvrir comment cet algorithme recherche des clusters de clients qui partagent des caractéristiques similaires. Par exemple, vous pouvez constater que certains clients ont tendance à vivre à proximité les uns des autres, se rendre à vélo et avoir des antécédents d’éducation similaires. Vous pouvez utiliser ces clusters pour mieux comprendre comment différents clients sont liés et utiliser les informations pour créer une stratégie marketing qui cible des clients spécifiques.

Pour prédire si un client potentiel est susceptible d’acheter un vélo, vous allez créer un modèle d’exploration de données basé sur l’algorithme Microsoft Decision Trees. Cet algorithme examine les informations associées à chaque client potentiel et trouve des caractéristiques utiles pour prédire s’ils achèteront un vélo. Il compare ensuite les valeurs des caractéristiques des acheteurs de vélos précédents par rapport aux nouveaux clients potentiels pour déterminer si les nouveaux clients potentiels sont susceptibles d’acheter un vélo.

INSTRUCTION DE MODIFICATION DE LA STRUCTURE MINING

Pour ajouter un modèle d’exploration de données à la structure d’exploration de données, vous utilisez l’instruction ALTER MINING STRUCTURE (DMX). Le code de l’instruction peut être divisé en parties suivantes :

  • Identification de la structure d’extraction de données

  • Nommer le modèle d'exploration de données

  • Définition de la colonne clé

  • Définition des colonnes d’entrée et prédictives

  • Identification des modifications apportées à l’algorithme et aux paramètres

Voici un exemple générique de l’instruction ALTER MINING MODEL :

ALTER MINING STRUCTURE [<mining structure name>]  
ADD MINING MODEL [<mining model name>]  
(  
    [<key column>],  
    <mining model columns>,  
) USING <algorithm name>( <algorithm parameters> )  
WITH FILTER (<expression>)  

La première ligne du code identifie la structure d’exploration de données existante à laquelle les modèles d’exploration de données seront ajoutés :

ALTER MINING STRUCTURE [<mining structure name>]  

La ligne suivante du code nomme le modèle d’exploration de données qui sera ajouté à la structure d’exploration de données :

ADD MINING MODEL [<mining model name>]  

Pour plus d’informations sur l’affectation d’un nom à un objet dans DMX, consultez Identificateurs (DMX).

Les lignes suivantes du code définissent des colonnes de la structure d’exploration de données qui seront utilisées par le modèle d’exploration de données :

[<key column>],  
<mining model columns>  

Vous pouvez uniquement utiliser des colonnes qui existent déjà dans la structure d’exploration de données, et la première colonne de la liste doit être la colonne clé de la structure d’exploration de données.

La ligne suivante du code définit l’algorithme d’exploration de données qui génère le modèle d’exploration de données et les paramètres d’algorithme que vous pouvez définir sur l’algorithme :

) USING <algorithm name>( <algorithm parameters> )  

Pour plus d’informations sur les paramètres d’algorithme que vous pouvez ajuster, consultez l’algorithme Microsoft Decision Trees et l’algorithme de clustering Microsoft.

Vous pouvez spécifier qu’une colonne dans le modèle d’exploration de données doit être utilisée pour la prédiction à l’aide de la syntaxe suivante :

<mining model column> PREDICT  

La dernière ligne du code, facultative, définit un filtre appliqué lors de l’entraînement et du test du modèle. Pour plus d’informations sur l’application de filtres aux modèles d’exploration de données, consultez Filtres pour les modèles d’exploration de données (Analysis Services - Exploration de données).

Tâches de la leçon

Vous allez effectuer les tâches suivantes dans cette leçon :

  • Ajouter un modèle d’exploration de données d’arbre de décision à la structure Bike Buyer à l’aide de l’algorithme Microsoft Decision Trees

  • Ajouter un modèle de regroupement à la structure Bike Buyer en utilisant l’algorithme Microsoft Clustering.

  • Étant donné que vous souhaitez afficher les résultats pour tous les cas, vous n’ajouterez pas encore de filtre à l’un ou l’autre des modèles.

Ajout d’un modèle d’exploration de données d’arbre de décision à la structure

La première étape consiste à ajouter un modèle d’exploration de données basé sur l’algorithme Microsoft Decision Trees.

Pour ajouter un modèle d’exploration de données d’arbre de décision

  1. Dans l’Explorateur d’objets, cliquez avec le bouton droit sur l’instance d’Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX pour ouvrir l’Éditeur de requête et une nouvelle requête vide.

  2. Copiez l’exemple générique de l’instruction ALTER MINING STRUCTURE dans la requête vide.

  3. Remplacez ce qui suit :

    <mining structure name>   
    

    avec :

    [Bike Buyer]  
    
  4. Remplacez ce qui suit :

    <mining model name>   
    

    avec :

    Decision Tree  
    
  5. Remplacez ce qui suit :

    <mining model columns>,  
    

    avec :

    (  
       CustomerKey,  
       [Age],  
       [Bike Buyer] PREDICT,  
       [Commute Distance],  
       [Education],  
       [Gender],  
       [House Owner Flag],  
       [Marital Status],  
       [Number Cars Owned],  
       [Number Children At Home],  
       [Occupation],  
       [Region],  
       [Total Children],  
       [Yearly Income]  
    

    Dans ce cas, la [Bike Buyer] colonne a été désignée comme colonne PREDICT.

  6. Remplacez ce qui suit :

    USING <algorithm name>( <algorithm parameters> )   
    

    avec :

    Using Microsoft_Decision_Trees  
    WITH DRILLTHROUGH  
    

    L’instruction WITH DRILLTHROUGH vous permet d’explorer les cas utilisés pour générer le modèle d’exploration de données.

    L’instruction résultante doit maintenant être la suivante :

    ALTER MINING STRUCTURE [Bike Buyer]  
    ADD MINING MODEL [Decision Tree]  
    (  
       CustomerKey,  
       [Age],  
       [Bike Buyer] PREDICT,  
       [Commute Distance],  
       [Education],  
       [Gender],  
       [House Owner Flag],  
       [Marital Status],  
       [Number Cars Owned],  
       [Number Children At Home],  
       [Occupation],  
       [Region],  
       [Total Children],  
       [Yearly Income]  
    ) USING Microsoft_Decision_Trees  
    WITH DRILLTHROUGH  
    
  7. Dans le menu Fichier , cliquez sur Enregistrer DMXQuery1.dmx As.

  8. Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier DT_Model.dmx.

  9. Dans la barre d’outils, cliquez sur le bouton Exécuter .

Ajout d'un modèle d'exploration par clustering à la structure

Vous pouvez maintenant ajouter un modèle d’exploration de données à la structure d’exploration de données Bike Buyer en fonction de l’algorithme Microsoft Clustering. Étant donné que le modèle d’exploration de données de clustering utilise toutes les colonnes définies dans la structure d’exploration de données, vous pouvez utiliser un raccourci pour ajouter le modèle à la structure en omettant la définition des colonnes d’exploration de données.

Pour ajouter un modèle d’exploration de données clustering

  1. Dans l’Explorateur d’objets, cliquez avec le bouton droit sur l’instance d’Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX pour ouvrir l’Éditeur de requête et une nouvelle requête vide.

  2. Copiez l’exemple générique de l’instruction ALTER MINING STRUCTURE dans la requête vide.

  3. Remplacez ce qui suit :

    <mining structure name>   
    

    avec :

    [Bike Buyer]  
    
  4. Remplacez ce qui suit :

    <mining model>   
    

    avec :

    Clustering Model  
    
  5. Supprimez le code suivant :

    (  
        [<key column>],  
        <mining model columns>,  
    )  
    
  6. Remplacez ce qui suit :

    USING <algorithm name>( <algorithm parameters> )  
    

    avec :

    USING Microsoft_Clustering  
    

    L’instruction complète doit maintenant être la suivante :

    ALTER MINING STRUCTURE [Bike Buyer]  
    ADD MINING MODEL [Clustering]  
    USING Microsoft_Clustering   
    
  7. Dans le menu Fichier , cliquez sur Enregistrer DMXQuery1.dmx As.

  8. Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier Clustering_Model.dmx.

  9. Dans la barre d’outils, cliquez sur le bouton Exécuter .

Dans la leçon suivante, vous allez traiter les modèles et la structure d’exploration de données.

Leçon suivante

Leçon 3 : Traitement de la structure d’exploration de données Bike Buyer