Distributions de colonnes (exploration de données)

Dans Microsoft SQL Server Analysis Services, vous pouvez définir des distributions de colonnes dans une structure d’exploration de données afin d’affecter la façon dont les algorithmes traitent les données dans ces colonnes lorsque vous créez des modèles d’exploration de données. Pour certains algorithmes, il est utile de définir la distribution de colonnes continues avant de traiter le modèle, si les colonnes sont connues pour contenir des distributions courantes de valeurs. Si vous ne définissez pas les distributions, les modèles d’exploration de données résultants peuvent produire des prédictions moins précises que si les distributions ont été définies, car les algorithmes auront moins d’informations à partir desquels interpréter les données.

Les algorithmes disponibles dans Analysis Services prennent en charge les types de distribution suivants :

Normal Les valeurs de la colonne continue forment un histogramme avec une distribution normale.

Histogramme avec distribution normale

Log Normal Les valeurs de la colonne continue forment un histogramme, où la courbe est allongée à l’extrémité supérieure et est asymétrique vers l’extrémité inférieure.

Histogramme avec distribution log-normale

Uniform Les valeurs de la colonne continue forment une courbe plate, dans laquelle toutes les valeurs sont également susceptibles.

Histogramme avec distribution uniforme

Pour plus d’informations sur les algorithmes fournis par Analysis Services, consultez Algorithmes d’exploration de données (Analysis Services - Exploration de données).

Voir aussi

Types de contenu (exploration de données)Structures d’exploration de données (Analysis Services - Exploration de données)Méthodes de discrétisation (Exploration de données)Distributions (DMX)Colonnes de structure d’exploration de données

Last updated on 2017-06-13

Partager via

Distributions de colonnes (exploration de données)

Voir aussi

Ressources supplémentaires