Partager via


Créer une structure d’exploration de données OLAP

Vous pouvez utiliser l’Assistant Exploration de données dans Microsoft SQL Server Analysis Services pour créer une structure d’exploration de données qui utilise des données à partir d’un modèle multidimensionnel. Les modèles d’exploration de données basés sur des cubes OLAP peuvent utiliser la colonne et les valeurs dans les tables de faits, les dimensions et les groupes de mesures en tant qu’attributs pour l’analyse.

Pour créer une structure d’exploration de données OLAP

  1. Dans l’Explorateur de solutions dans SQL Server Data Tools (SSDT), cliquez avec le bouton droit sur le dossier Structures d’exploration de données dans un projet Analysis Services, puis cliquez sur Nouvelle structure d’exploration de données pour ouvrir l’Assistant Exploration de données.

  2. Dans la page Bienvenue dans l’Assistant Exploration de données , cliquez sur Suivant.

  3. Dans la page Sélectionner la méthode de définition , sélectionnez À partir du cube existant, puis cliquez sur Suivant.

    Si vous obtenez une erreur avec le message, Impossible de récupérer la liste des algorithmes d’exploration de données pris en charge, ouvrez la boîte de dialogue Propriétés du projet et vérifiez que vous avez spécifié le nom d’une instance Analysis Services qui prend en charge les modèles multidimensionnels. Vous ne pouvez pas créer de modèles d’exploration de données sur une instance d’Analysis Services qui prend en charge la modélisation tabulaire.

  4. Dans la page Créer la structure d’exploration de données , déterminez si vous allez créer une structure d’exploration de données uniquement ou une structure d’exploration de données plus un modèle d’exploration de données associé. En règle générale, il est plus facile de créer un modèle d’exploration de données en même temps, afin que vous puissiez être invité à inclure les colonnes nécessaires.

    Si vous créez un modèle d’exploration de données, sélectionnez l’algorithme d’exploration de données que vous souhaitez utiliser, puis cliquez sur Suivant. Pour plus d’informations sur la façon de choisir un algorithme, consultez Algorithmes d’exploration de données (Analysis Services - Exploration de données).

  5. Dans la page Sélectionner la dimension de cube source , sous Sélectionner une dimension de cube source, recherchez la dimension qui contient la majorité de vos données de cas.

    Par exemple, si vous essayez d’identifier les regroupements de clients, vous pouvez choisir la dimension Customer ; si vous essayez d’analyser les achats entre les transactions, vous pouvez choisir la dimension Détails des commandes Internet. Vous n’êtes pas limité à utiliser uniquement les données de cette dimension, mais il doit contenir des attributs importants à utiliser dans l’analyse.

    Cliquez sur Suivant.

  6. Dans la page Sélectionner la clé de cas, sous Attributs, sélectionnez l’attribut qui sera la clé de la structure d’exploration de données, puis cliquez sur Suivant.

    En règle générale, l’attribut que vous utilisez comme clé pour la structure d’exploration de données est également une clé pour la dimension et sera préselectionné.

  7. Sur la page Select Case Level Columns, sous Attributs et mesures connexes, sélectionnez les attributs et les mesures contenant les valeurs que vous souhaitez ajouter à la structure d’exploration de données comme données de cas. Cliquez sur Suivant.

  8. Dans la page Spécifier l’utilisation des colonnes de modèle d’exploration de données, sous structure de modèle d’exploration de données, définissez d’abord la colonne prédictible, puis choisissez les colonnes à utiliser comme entrées.

    • Cochez la case dans la colonne la plus à gauche pour inclure les données dans le modèle d'exploration de données. Vous pouvez inclure des colonnes dans la structure que vous utiliserez pour référence, mais pas les utiliser pour l’analyse.

    • Cochez la case dans la colonne Entrée pour utiliser l’attribut comme variable dans l’analyse.

    • Cochez la case dans la colonne Prédire uniquement pour les attributs prédictibles.

    Notez que les colonnes que vous avez désignées comme clés ne peuvent pas être utilisées pour l’entrée ou la prédiction.

    Cliquez sur Suivant.

  9. Dans la page Spécifier l’utilisation des colonnes de modèle d’exploration de données, vous pouvez également ajouter et supprimer des tables imbriquées à la structure d’exploration de données, à l’aide d’Ajouter des tables imbriquées et des tables imbriquées.

    Dans un modèle d’exploration de données OLAP, une table imbriquée est un autre ensemble de données dans le cube qui a une relation un-à-plusieurs avec la dimension qui représente les attributs de cas. Par conséquent, lorsque la boîte de dialogue s’ouvre, elle sélectionne préalablement les groupes de mesures qui sont déjà liés à la dimension que vous avez sélectionnée comme table de cas. À ce stade, vous devez choisir une autre dimension qui contient des informations supplémentaires utiles pour l’analyse.

    Par exemple, si vous analysez des clients, vous utilisez la dimension [Customer] comme table de cas. Pour la table imbriquée, vous pouvez ajouter la raison invoquée par les clients lors de l'achat, qui est incluse dans la dimension [Sales Reason].

    Si vous ajoutez des données imbriquées, vous devez spécifier deux colonnes supplémentaires :

    • Clé de la table imbriquée : celle-ci doit être pré-sélectionnée sur la page, sélectionnez Clé de table imbriquée.

    • Attributs ou attributs à utiliser pour l’analyse : la page, Sélectionner les colonnes de table imbriquées, fournit une liste de mesures et d’attributs dans la sélection de table imbriquée.

      • Pour chaque attribut que vous incluez dans le modèle, cochez la case dans la colonne de gauche.

      • Si vous souhaitez utiliser l’attribut pour l’analyse uniquement, vérifiez l’entrée.

      • Si vous souhaitez inclure la colonne comme l’un des attributs prédictibles du modèle, sélectionnez Prédire.

      • Tout élément que vous incluez dans la structure, mais que vous ne spécifiez pas comme attribut d’entrée ou prédictible, est ajouté à la structure avec l’indicateur Ignore. Cela signifie que les données sont traitées lorsque vous générez le modèle, mais ne sont pas utilisées dans l’analyse et sont disponibles uniquement pour le forage de données. Cela peut être pratique si vous souhaitez inclure des détails tels que les noms de clients, mais ne souhaitez pas les utiliser dans l’analyse.

    Cliquez sur Terminer pour fermer la partie de l'Assistant dédiée aux tables imbriquées. Vous pouvez répéter le processus pour ajouter plusieurs colonnes imbriquées.

  10. Dans la page Spécifier le contenu et le type de données des colonnes , sous structure de modèle d’exploration de données, définissez le type de contenu et le type de données pour chaque colonne.

    Remarque

    Les modèles d’exploration de données OLAP ne prennent pas en charge l’utilisation de la fonctionnalité Detect pour détecter automatiquement si une colonne contient des données continues ou discrètes.

    Cliquez sur Suivant.

  11. Dans la page Cube source de découpe, vous pouvez filtrer les données utilisées pour créer la structure de forage de données.

    Le découpage du cube vous permet de restreindre les données utilisées pour générer le modèle. Par exemple, vous pouvez créer des modèles distincts pour chaque région en découpant sur la hiérarchie géographique et

    • Dimension : choisissez une dimension associée dans la liste déroulante.

    • Hiérarchie : sélectionnez le niveau de la hiérarchie de dimension auquel vous souhaitez appliquer le filtre. Par exemple, si vous découpez par la dimension [Geography], vous devez choisir un niveau de hiérarchie tel que [Nom du pays de la région] .

    • Opérateur : choisissez un opérateur dans la liste.

    • Expression de filtre : tapez une valeur ou une expression pour servir de condition de filtre ou utilisez la liste déroulante pour sélectionner une valeur dans la liste des membres au niveau spécifié de la hiérarchie.

      Par exemple, si vous avez sélectionné [Geography] comme dimension et [Nom du pays de la région] comme niveau hiérarchique, la liste déroulante contient tous les pays/régions valides que vous pouvez utiliser comme condition de filtre. Vous pouvez effectuer plusieurs sélections. Par conséquent, les données de la structure de données d’exploration seront limitées aux données contenues dans le cube de ces zones géographiques.

    • Paramètres : ignorez cette case à cocher. Cette boîte de dialogue prend en charge plusieurs scénarios de filtrage de cube et cette option n’est pas pertinente pour créer une structure pour l'extraction de données.

    Cliquez sur Suivant.

  12. Sur la page Fractionner les données en ensembles d'apprentissage et de test, spécifiez un pourcentage des données de la structure minière à réserver pour les tests, ou spécifiez le nombre maximal de cas de test. Cliquez sur Suivant.

    Si vous spécifiez les deux valeurs, les limites sont combinées pour utiliser la valeur la plus faible.

  13. Dans la page Fin de l’Assistant , indiquez un nom pour la nouvelle structure d’exploration de données OLAP et le modèle d’exploration de données initial.

  14. Cliquez sur Terminer.

  15. Dans la page Fin de l’Assistant , vous avez également la possibilité de créer une dimension de modèle d’exploration de données et/ou un cube à l’aide de la dimension du modèle d’exploration de données. Ces options sont prises en charge uniquement pour les modèles générés à l’aide des algorithmes suivants :

    • Algorithme de regroupement Microsoft

    • Algorithme Microsoft Decision Trees

    • Algorithme des règles d'association de Microsoft

    Créer une dimension de modèle d’exploration de données : activez cette case à cocher et fournissez un nom de type pour la dimension du modèle d’exploration de données. Lorsque vous utilisez cette option, une nouvelle dimension est créée dans le cube d'origine utilisé pour générer la structure d’exploration de données. Vous pouvez utiliser cette dimension pour explorer et effectuer une analyse plus approfondie. Étant donné que la dimension se trouve dans le cube, la dimension est automatiquement mappée à la dimension de données de cas.

    Créer un cube à l’aide de la dimension du modèle d’exploration de données : cochez cette case et indiquez un nom pour le nouveau cube. Lorsque vous utilisez cette option, un nouveau cube est créé qui contient les dimensions existantes utilisées dans la création de la structure et la nouvelle dimension d’exploration de données qui contient les résultats du modèle.

Voir aussi

Tâches de structure d’exploration de données et procédure