Architecture logique (Analysis Services - Exploration de données)

L’exploration de données est un processus qui implique l’interaction de plusieurs composants.

Vous accédez à des sources de données dans une base de données SQL Server ou toute autre source de données à utiliser pour l’apprentissage, le test ou la prédiction.
Vous définissez des structures et des modèles d’exploration de données à l’aide de SQL Server Data Tools (SSDT) ou de Visual Studio.
Vous gérez les objets d’exploration de données et créez des prédictions et des requêtes à l’aide de SQL Server Management Studio.
Une fois la solution terminée, vous la déployez sur une instance d’Analysis Services.

Le processus de création de ces objets solution a déjà été décrit ailleurs. Pour plus d’informations, consultez Solutions d’exploration de données.

Données sources d’exploration de données

Les données que vous utilisez dans l’exploration de données ne sont pas stockées dans la solution d’exploration de données ; seules les liaisons sont stockées. Les données peuvent résider dans une base de données créée dans une version précédente de SQL Server, un système CRM ou même un fichier plat. Lorsque vous effectuez l’apprentissage de la structure ou du modèle par traitement, un résumé statistique des données est créé et stocké dans un cache qui peut être conservé pour une utilisation dans des opérations ultérieures ou supprimé après le traitement. Pour plus d’informations, consultez Structures d’exploration de données (Analysis Services - Exploration de données).

Vous combinez des données disparates dans l’objet DSV (Data Source View) Analysis Services, qui fournit une couche d’abstraction au-dessus de votre source de données. Vous pouvez spécifier des jointures entre des tables ou ajouter des tables qui ont une relation plusieurs-à-un pour créer des colonnes de table imbriquées. La définition de ces objets, la source de données et la vue de source de données sont stockées dans la solution avec les extensions de nom de fichier *.ds et *.dsv. Pour plus d’informations sur la création et l’utilisation des sources de données Analysis Services et des vues de sources de données, consultez Sources de données prises en charge (multidimensionnel SSAS).

Vous pouvez également définir et modifier des sources de données et des vues de sources de données à l’aide d’AMO ou XMLA. Pour plus d’informations sur l’utilisation de ces objets par programmation, consultez Vue d’ensemble de l’architecture logique (Analysis Services - Données multidimensionnelles).

Structures d’exploration de données

Une structure d’exploration de données est un conteneur de données logique qui définit le domaine de données à partir duquel les modèles d’exploration de données sont générés. Une seule structure d’exploration de données peut prendre en charge plusieurs modèles d’exploration de données.

Lorsque vous devez utiliser les données dans la solution d’exploration de données, Analysis Services lit les données de la source et génère un cache d’agrégats et d’autres informations. Par défaut, ce cache est conservé afin que les données d’apprentissage puissent être réutilisées pour prendre en charge des modèles supplémentaires. Si vous devez supprimer le cache, remplacez la CacheMode propriété de l’objet de structure d’exploration de données par la valeur ClearAfterProcessing. Pour plus d’informations, consultez Classes d’exploration de données AMO.

SQL Server 2014 Analysis Services (SSAS) offre également la possibilité de séparer vos données en jeux de données d’apprentissage et de test, afin que vous puissiez tester vos modèles d’exploration de données sur un ensemble de données représentatif et sélectionné de manière aléatoire. Les données ne sont pas stockées séparément ; au lieu de cela, les données de cas dans le cache de structure sont marquées avec une propriété qui indique si ce cas particulier est utilisé pour l’entraînement ou pour les tests. Si le cache est supprimé, ces informations ne peuvent pas être récupérées.

Pour plus d’informations, consultez Structures d’exploration de données (Analysis Services - Exploration de données).

Une structure d’exploration de données peut contenir des tables imbriquées. Une table imbriquée fournit des détails supplémentaires sur le cas modélisé dans la table de données primaire. Pour plus d’informations, consultez Tables imbriquées (Analysis Services - Exploration de données)

Modèles d’exploration de données

Avant le traitement, un modèle d’exploration de données n’est qu’une combinaison de propriétés de métadonnées. Ces propriétés spécifient une structure d’exploration de données, spécifient un algorithme d’exploration de données et définissent une collection de paramètres et de paramètres de filtre qui affectent la façon dont les données sont traitées. Pour plus d’informations, consultez Modèles d’exploration de données (Analysis Services - Exploration de données).

Lorsque vous traitez le modèle, les données d’apprentissage stockées dans le cache de structure d’exploration de données sont utilisées pour générer des modèles, en fonction des propriétés statistiques des données et des heuristiques définies par l’algorithme et ses paramètres. Il s’agit de l’apprentissage du modèle.

Le résultat de l’entraînement est un ensemble de données récapitulatives, contenues dans le contenu du modèle, qui décrit les modèles trouvés et fournit des règles pour générer des prédictions. Pour plus d’informations, consultez Contenu du modèle d’exploration de données (Analysis Services - Exploration de données).

Dans des cas limités, la structure logique du modèle peut également être exportée dans un fichier qui représente des formules de modèle et des liaisons de données selon un format standard, le langage PMML (Predictive Modeling Markup Language). Cette structure logique peut être importée dans d’autres systèmes qui utilisent PMML et le modèle décrit peut ensuite être utilisé pour la prédiction. Pour plus d’informations, consultez Présentation de l’instruction Select DMX.

Objets d’exploration de données personnalisés

Les autres objets que vous utilisez dans le contexte d’un projet d’exploration de données, tels que des graphiques de précision ou des requêtes de prédiction, ne sont pas conservés dans la solution, mais peuvent être scriptés à l’aide d’ASSL ou générés à l’aide d’AMO.

En outre, vous pouvez étendre les services et fonctionnalités disponibles sur une instance d’Analysis Services en ajoutant ces objets personnalisés :

Assemblages personnalisés
Les assemblys .NET peuvent être définis à l’aide de n’importe quel langage CLR-ou COM-complaint, puis inscrits auprès d’une instance de SQL Server. Les fichiers d’assembly sont chargés à partir de l’emplacement défini par l’application, et une copie est enregistrée sur le serveur, ainsi que les données. La copie du fichier d'assemblage est utilisée pour charger l'assemblage chaque fois que le service démarre.

Pour plus d’informations, consultez Gestion des assemblys de modèle multidimensionnel.

Procédures stockées personnalisées
Les services d'analyse pour l'exploration de données prennent en charge l'utilisation de procédures stockées pour manipuler des objets d'exploration de données. Vous pouvez créer vos propres procédures stockées pour étendre les fonctionnalités et utiliser plus facilement les données retournées par les requêtes de prédiction et les requêtes de contenu.

Définition de procédures stockées

Les procédures stockées suivantes sont prises en charge pour une utilisation dans l’exécution d’une validation croisée.

Procédures stockées d’exploration de données (Analysis Services - Exploration de données)

En outre, Analysis Services contient de nombreuses procédures stockées système utilisées en interne pour l’exploration de données. Bien que les procédures stockées système soient destinées à une utilisation interne, vous pouvez les trouver des raccourcis utiles. Microsoft se réserve le droit de modifier ces procédures stockées si nécessaire ; Par conséquent, pour une utilisation en production, nous vous recommandons de créer des requêtes à l’aide de DMX, AMO ou XMLA.

Algorithmes de plug-in personnalisés
Analysis Services fournit un mécanisme permettant de créer vos propres algorithmes, puis d’ajouter les algorithmes en tant que nouveau service d’exploration de données à l’instance de serveur.

Analysis Services utilise des interfaces COM pour communiquer avec des algorithmes de plug-in. Pour en savoir plus sur l’implémentation de nouveaux algorithmes, consultez Algorithmes de plug-in.

Vous devez inscrire chaque nouvel algorithme avant de pouvoir l’utiliser. Pour inscrire un algorithme, vous ajoutez les métadonnées requises pour les algorithmes dans le fichier .ini de l’instance d’Analysis Services. Vous devez ajouter les informations à chaque instance où vous envisagez d’utiliser le nouvel algorithme. Une fois que vous avez ajouté l’algorithme, vous pouvez redémarrer l’instance et utiliser l’ensemble de lignes de schéma MINING_SERVICES pour afficher le nouvel algorithme, y compris les options et les fournisseurs pris en charge par l’algorithme.

Voir aussi

Traitement d’objet de modèle multidimensionnel
Informations de référence sur les extensions d’exploration de données (DMX)

Last updated on 2017-04-27

Partager via