Partager via


Exigences et considérations relatives au traitement (exploration de données)

Cette rubrique décrit certaines considérations techniques à prendre en compte lors du traitement des objets d’exploration de données. Pour obtenir une explication générale sur le traitement et la façon dont il s’applique à l’exploration de données, consultez Traitement des objets d’exploration de données.

Requêtes sur le stockage relationnel

Traitement des structures de minage

Traitement des modèles d’exploration de données

Requêtes sur le magasin relationnel pendant le traitement

Pour l’exploration de données, il existe trois phases de traitement : interrogation des données sources, détermination des statistiques brutes et utilisation de la définition de modèle et de l’algorithme pour entraîner le modèle d’exploration de données.

Le serveur Analysis Services émet des requêtes sur la base de données qui fournit les données brutes. Cette base de données peut être une instance de SQL Server 2014 ou une version antérieure du moteur de base de données SQL Server. Lorsque vous traitez une structure d’exploration de données, les données de la source sont transférées vers la structure d’exploration de données et conservées sur le disque dans un nouveau format compressé. Toutes les colonnes de la source de données ne sont pas traitées : seules les colonnes incluses dans la structure minière, telles que définies par les liaisons techniques.

À l’aide de ces données, Analysis Services génère un index de toutes les données et colonnes discrétisées, et crée un index distinct pour les colonnes continues. Une requête est émise pour chaque table imbriquée pour créer l’index, et une requête supplémentaire par table imbriquée est générée pour traiter les relations entre chaque paire d’une table imbriquée et une table de cas. La raison de la création de plusieurs requêtes consiste à traiter un magasin de données multidimensionnel interne spécial. Vous pouvez limiter le nombre de requêtes envoyées par Analysis Services au magasin relationnel en définissant la propriété du serveur. DatabaseConnectionPoolMax Pour plus d’informations, consultez Propriétés OLAP.

Lorsque vous traitez ou exécutez le modèle, le modèle ne relit pas les données de la source de données, mais obtient plutôt le résumé des données de la structure de données d'exploration. À l'aide du cube créé, de l'index et des données de cas mis en cache, le serveur crée des threads indépendants pour entraîner les modèles.

Pour plus d’informations sur les éditions de SQL Server qui prennent en charge le traitement de modèle parallèle, consultez Fonctionnalités prises en charge par les éditions de SQL Server 2012 (https://go.microsoft.com/fwlink/?linkid=232473).

Traitement des structures d’exploration de données

Une structure d’exploration de données peut être traitée avec tous les modèles dépendants ou séparément. Le traitement d’une structure d’exploration de données séparément des modèles peut être utile lorsque certains modèles sont censés prendre beaucoup de temps pour traiter et que vous souhaitez différer cette opération.

Pour plus d’informations, consultez Traiter une structure d’exploration de données.

Si vous êtes préoccupé par la conservation de l’espace disque dur, notez que Analysis Services conserve les caches de structure d’exploration de données localement. Autrement dit, il écrit toutes les données d’entraînement sur votre disque dur local. Si vous ne souhaitez pas que les données soient mises en cache, vous pouvez modifier la valeur par défaut en définissant la propriété MiningStructureCacheMode sur la structure d'exploration de données ClearAfterProcessing. Cela va détruire le cache une fois les modèles traités ; cependant, cela désactivera également la fonctionnalité de drillthrough sur la structure d'exploration. Pour plus d’informations, consultez Requêtes d’extraction (exploration de données).

En outre, si vous effacez le cache, vous ne pourrez pas utiliser le jeu de test de blocage, si vous en avez défini un, et la définition de la partition du jeu de tests sera perdue. Pour plus d’informations sur les jeux de tests de blocage, consultez Training and Testing Data Sets.

Traitement des modèles d’exploration de données

Vous pouvez traiter un modèle d’exploration de données séparément de sa structure d’exploration de données associée, ou traiter tous les modèles basés sur la structure, ainsi que la structure.

Pour plus d’informations, consultez Processer un modèle d’exploration de données.

Toutefois, dans SQL Server Data Tools (SSDT) et SQL Server Management Studio, vous ne pouvez pas sélectionner plusieurs modèles d’exploration de données à traiter avec la structure. Si vous devez contrôler les modèles traités, vous devez les sélectionner individuellement, ou utiliser XMLA ou DMX pour traiter les modèles en série.

Lorsque le retraitement est requis

Vous devez traiter les modèles Analysis Services que vous définissez avant de commencer à travailler avec eux. Vous devez également retraiter les modèles d’exploration de données chaque fois que vous modifiez la structure du modèle d’exploration de données, mettez à jour les données d’apprentissage, modifiez un modèle d’exploration de données existant ou ajoutez un nouveau modèle d’exploration de données à la structure.

Les modèles d’exploration de données sont également traités dans ces scénarios :

Déploiement d’un projet : en fonction des paramètres du projet et de l’état actuel du projet, les modèles d’exploration de données du projet sont généralement traités entièrement lorsque le projet est déployé.

Lorsque vous lancez le déploiement, le traitement démarre automatiquement, sauf s’il existe une version précédemment traitée sur le serveur Analysis Services et qu’aucune modification structurelle n’a été apportée. Vous pouvez déployer un projet en sélectionnant Déployer une solution dans la liste déroulante ou en appuyant sur la touche F5. Vous pouvez

Pour plus d’informations sur la définition des propriétés de déploiement Analysis Services qui contrôlent la façon dont les modèles d’exploration de données sont déployés, consultez Déploiement de solutions d’exploration de données.

Déplacement d’un modèle d’exploration de données : lorsque vous déplacez un modèle d’exploration de données à l’aide de la commande EXPORT, seule la définition du modèle est exportée, ce qui inclut le nom de la structure d’exploration de données attendue pour fournir des données au modèle.

Exigences de retraitement pour les scénarios ci-dessous, en utilisant les commandes EXPORT et IMPORT.

  • La structure d’exploration de données existe sur l’instance cible et la structure d’exploration de données est dans un état non traité.

    La structure et le modèle doivent être retrachés.

  • La structure d’exploration de données existe sur l’instance cible et la structure d’exploration de données a été traitée. Seul le modèle d’exploration de données a été exporté.

    Le modèle peut être utilisé sans traitement.

  • La définition de structure d’exploration de données a également été exportée à l’aide du mot clé WITH DEENDENCIES.

    La structure et le modèle doivent être retravaillés.

Pour plus d’informations, consultez Exporter et importer des objets d’exploration de données.

Voir aussi

Structures d’exploration de données (Analysis Services - Exploration de données)
Structures d’exploration de données (Analysis Services - Exploration de données)
Traitement d’objet de modèle multidimensionnel