Partager via


Colonnes de structure d’exploration de données

Vous définissez les colonnes d’une structure d’exploration de données lorsque vous créez la structure d’exploration de données, en choisissant des colonnes de données externes, puis en spécifiant la façon dont les données doivent être utilisées pour la modélisation. Par conséquent, les colonnes de structure d’exploration de données sont plus que des copies de données d’une source de données : elles définissent la façon dont les données de la source doivent être utilisées par le modèle d’exploration de données. Vous pouvez affecter des propriétés qui déterminent la façon dont les données sont discrétisées, les propriétés qui décrivent la façon dont les valeurs de données sont distribuées

Les colonnes de structure d’exploration de données sont conçues pour être flexibles et extensibles, car chaque algorithme que vous utilisez pour créer un modèle d’exploration de données peut utiliser des colonnes différentes de la structure pour interpréter les données. Au lieu d’avoir un ensemble de données pour chaque modèle, vous pouvez utiliser une seule structure d’exploration de données et utiliser les colonnes qu’elle contient pour personnaliser les données pour chaque modèle.

Définition des colonnes de structure de données

Les types de données de base et les types de contenu qui définissent des colonnes de structure sont dérivés de la source de données que vous utilisez pour créer la structure. Vous pouvez modifier ces paramètres dans la structure d’exploration de données, et vous pouvez également définir des indicateurs de modélisation et définir la distribution pour les colonnes continues.

La définition d’une colonne de structure d’exploration de données doit contenir les informations suivantes :

  • ID : nom unique de la colonne, souvent identique au nom. Cela ne peut pas être modifié après avoir créé la structure d’exploration de données, alors que le nom peut être modifié.

  • Nom : nom ou alias de la colonne.

  • Contenu : énumération qui décrit si les données sont discrètes ou continues.

  • Type : énumération qui indique le type de données général.

  • Distribution : énumération qui décrit la distribution attendue des valeurs. Une distribution est incluse si la colonne est continue.

  • Indicateurs de modélisation : énumération qui indique comment gérer les valeurs manquantes et ainsi de suite. Les indicateurs de modélisation peuvent également être définis sur le modèle d’exploration de données, mais les indicateurs de modèle sont différents des indicateurs utilisés sur les colonnes de structure.

  • Liaisons : propriétés qui spécifient les données sources.

Les algorithmes tiers peuvent également inclure des propriétés personnalisées qui peuvent être définies sur la colonne de la structure d'exploration de données.

Pour plus d’informations sur la structure d’exploration de données et le modèle d’exploration de données, consultez Structures d’exploration de données (Analysis Services - Exploration de données).

Pour plus d’informations sur la manière de définir et d’utiliser les colonnes de structure de données, consultez les sujets suivants.

Sujet Liens
Décrit les types de données que vous pouvez utiliser pour définir une colonne dans une structure d'exploration minière. Types de données (exploration de données)
Décrit les types de contenu disponibles pour chaque type de données présentes dans une colonne de la structure minière de données. Les types de contenu dépendent du type de données. Le type de contenu est affecté au niveau du modèle et détermine la façon dont les données de colonne sont utilisées par le modèle. Types de contenu (exploration de données)
Présente le concept de tables imbriquées et explique comment les tables imbriquées peuvent être ajoutées à la source de données en tant que colonnes de structure d’exploration de données. Colonnes classifiées (exploration de données)
Explique et liste les propriétés de distribution que l'on peut définir sur une colonne de structure de données de data mining pour déterminer la distribution attendue des valeurs dans cette colonne. Distributions de colonnes (exploration de données)
Explique le concept de discrétisation (parfois appelée binning) et décrit les méthodes que Analysis Services fournit pour discrétiser les données numériques continues. Méthodes de discrétisation (exploration de données)
Décrit les indicateurs de modélisation que vous pouvez définir pour une colonne de structure de données de fouille. Indicateurs de modélisation (exploration de données)
Décrit les colonnes classifiées, qui sont un type spécial de colonne permettant de relier une colonne d'une structure de fouille de données à une autre. Colonnes classifiées (exploration de données)
Découvrez comment ajouter et modifier des colonnes de structure d’exploration de données. Tâches de structure d’exploration de données et procédure

Voir aussi

Structures d’exploration de données (Analysis Services - Exploration de données)
Colonnes du modèle d’exploration de données