Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Les requêtes d’exploration de données sont utiles à de nombreuses fins. Vous pouvez:
Appliquez le modèle à de nouvelles données pour effectuer des prédictions uniques ou multiples. Vous pouvez fournir des valeurs d’entrée en tant que paramètres ou dans un lot.
Obtenez un résumé statistique des données utilisées pour l’entraînement.
Extrayez des modèles et des règles, ou générez un profil du cas classique représentant un modèle dans le modèle.
Extrayez des formules de régression et d’autres calculs qui expliquent les modèles.
Obtenez les cas qui correspondent à un modèle particulier.
Récupérez des détails sur les cas individuels utilisés dans le modèle, y compris les données non utilisées dans l’analyse.
Réentraînez un modèle en ajoutant de nouvelles données ou en effectuant une prédiction croisée.
Cette section fournit une vue d’ensemble des informations dont vous avez besoin pour commencer à utiliser les requêtes d’exploration de données. Il décrit les types de requêtes que vous pouvez créer sur des objets d’exploration de données, introduit les outils de requête et les langages de requête, et fournit des liens vers des exemples de requêtes que vous pouvez créer sur des modèles créés à l’aide des algorithmes fournis dans l’exploration de données SQL Server.
Présentation des requêtes d’exploration de données
Outils et interfaces de requête
Requêtes pour différents types de modèles
Présentation des requêtes d’exploration de données
Analysis Services Data Mining prend en charge les types de requêtes suivants :
Requêtes de prédiction (exploration de données)
Requêtes qui effectuent des inférences basées sur des modèles dans le modèle et à partir de données d’entrée.
Requêtes de contenu (exploration de données)
Requêtes qui retournent des métadonnées, des statistiques et d’autres informations sur le modèle lui-même.
Requêtes de forage (exploration de données)
Requêtes qui peuvent récupérer les données de cas sous-jacentes pour le modèle, ou même les données de la structure qui n’a pas été utilisée dans le modèle.
Requêtes de définition de données (exploration de données)
Les requêtes qui ne retournent pas d’informations à partir du modèle, mais sont plutôt utilisées pour générer des modèles et des structures ou pour mettre à jour les données dans un modèle ou une structure.
Avant de créer des requêtes, nous vous recommandons de vous familiariser avec les différences entre les modèles créés avec chacun des algorithmes d’exploration de données fournis par SQL Server.
Parcourez et explorez chaque type de modèle à l’aide des visionneuses d’exploration de données personnalisées fournies pour chaque type d’algorithme. Pour plus d’informations, consultez Tâches et guides pratiques du visionneur de modèles d’exploration de données.
Passez en revue le contenu du modèle pour chaque type de modèle à l’aide de la visionneuse d’arborescence de contenu générique Microsoft. Pour interpréter ces informations, reportez-vous au contenu du modèle d’exploration de données (Analysis Services - Exploration de données).
Outils et interfaces de requête
Vous pouvez créer des requêtes d’exploration de données de manière interactive à l’aide de l’un des outils de requête fournis par SQL Server. Le Générateur de requêtes de prédiction graphique est fourni dans SQL Server Data Tools (SSDT) et SQL Server Management Studio. Si vous n’avez pas déjà utilisé le Générateur de requêtes de prédiction, nous vous recommandons de suivre les étapes décrites dans le didacticiel d’exploration de données de base pour vous familiariser avec l’interface. Pour obtenir une vue d’ensemble rapide des étapes, consultez Créer une requête de prédiction à l’aide du Générateur de requêtes de prédiction.
Le Générateur de requêtes de prédiction est utile pour démarrer les requêtes que vous personnaliserez ultérieurement. Vous pouvez facilement ajouter des sources de données et les mapper à des colonnes, puis passer à la vue DMX et personnaliser la requête en ajoutant une clause WHERE ou d’autres fonctions.
Une fois que vous êtes familiarisé avec les modèles d’exploration de données et comment créer des requêtes, vous pouvez également écrire des requêtes directement à l’aide d’extensions d’exploration de données (DMX). DMX est un langage de requête similaire à Transact-SQL et que vous pouvez utiliser à partir de nombreux clients différents. DMX est l’outil de choix pour créer des prédictions personnalisées et des requêtes complexes. Pour une présentation de DMX, consultez Création et interrogation de modèles d’exploration de données avec DMX : Tutoriels (Analysis Services - Exploration de données)
Les éditeurs DMX sont fournis dans SQL Server Data Tools (SSDT) et SQL Server Management Studio. Vous pouvez également utiliser le Générateur de requêtes de prédiction pour démarrer vos requêtes, puis modifier l’affichage en éditeur de texte et copier l’instruction DMX vers un autre client. Pour plus d’informations, consultez Interfaces de requête d’exploration de données.
Vous pouvez composer des instructions DMX par programmation et les envoyer de votre client au serveur Analysis Services à l’aide d’AMO ou XMLA. Toutefois, DMX est le langage que vous devez utiliser pour créer des requêtes sur un modèle d’exploration de données.
Vous pouvez également interroger les métadonnées, les statistiques et le contenu du modèle à l’aide de vues de gestion dynamique (DMV) basées sur les ensembles de lignes de schéma d’exploration de données. Ces DMV facilitent la récupération d’informations sur le modèle en tapant des instructions SELECT ; toutefois, vous ne pouvez pas créer de prédictions. Pour plus d’informations sur les DMV prises en charge par Analysis Services, consultez Utiliser des vues de gestion dynamique (DMV) pour surveiller Analysis Services.
Enfin, vous pouvez créer des requêtes d’exploration de données à utiliser dans les packages Integration Services, à l’aide de la tâche de requête d’exploration de données ou de la transformation de requête d’exploration de données. La tâche de flux de contrôle prend en charge plusieurs types de requêtes DMX, tandis que la transformation de flux de données prend uniquement en charge les requêtes qui fonctionnent avec des données dans le flux de données, ce qui signifie que les requêtes qui utilisent la syntaxe PREDICTION JOIN.
Requêtes pour différents types de modèles
L’algorithme utilisé lorsque le modèle a été créé influence considérablement le type d’informations que vous pouvez obtenir à partir d’une requête d’exploration de données. La raison des différences est que chaque algorithme traite les données d’une manière différente et stocke différents types de modèles. Par exemple, certains algorithmes créent des clusters ; d’autres créent des arborescences. Par conséquent, vous devrez peut-être utiliser des fonctions de prédiction et de requête spécialisées, en fonction du type de modèle avec lequel vous travaillez.
La liste suivante fournit un résumé des fonctions que vous pouvez utiliser dans les requêtes :
Fonctions de prédiction générales : La
Predictfonction est polymorphe, ce qui signifie qu’elle fonctionne avec tous les types de modèle. Cette fonction détecte automatiquement le type de modèle avec lequel vous travaillez et vous invite à entrer des paramètres supplémentaires. Pour plus d’informations, consultez Predict (DMX).Avertissement
Tous les modèles ne sont pas utilisés pour effectuer des prédictions. Par exemple, vous pouvez créer un modèle de clustering qui n’a pas d’attribut prédictible. Toutefois, même si un modèle n’a pas d’attribut prédictible, vous pouvez créer des requêtes de prédiction qui retournent d’autres types d’informations utiles à partir du modèle.
Fonctions de prédiction personnalisées : Chaque type de modèle fournit un ensemble de fonctions de prédiction conçues pour travailler avec les modèles créés par cet algorithme.
Par exemple, la
Lagfonction est fournie pour les modèles de série chronologique pour vous permettre d’afficher les données historiques utilisées pour le modèle. Pour les modèles de clustering, les fonctions comme celles-ciClusterDistancesont plus significatives.Pour plus d’informations sur les fonctions prises en charge pour chaque type de modèle, consultez les liens suivants :
Vous pouvez également appeler des fonctions VBA ou créer vos propres fonctions. Pour plus d’informations, consultez Functions (DMX).
Statistiques générales : Il existe un certain nombre de fonctions qui peuvent être utilisées avec presque n’importe quel type de modèle, qui retournent un ensemble standard de statistiques descriptives, telles que l’écart type.
Par exemple, la
PredictHistogramfonction retourne une table qui répertorie tous les états de la colonne spécifiée.Pour plus d’informations, consultez Fonctions de prédiction générales (DMX).
Statistiques personnalisées : Des fonctions de prise en charge supplémentaires sont fournies pour chaque type de modèle, afin de générer des statistiques pertinentes pour la tâche analytique spécifique.
Par exemple, lorsque vous utilisez un modèle de clustering, vous pouvez utiliser la fonction,
PredictCaseLikelihoodpour retourner le score de probabilité associé à un certain cas et à un cluster. Toutefois, si vous avez créé un modèle de régression linéaire, vous serez plus intéressé par la récupération du coefficient et de l’interception, que vous pouvez effectuer à l’aide d’une requête de contenu.Fonctions de contenu de modèle : Le contenu de tous les modèles est représenté dans un format standardisé qui vous permet de récupérer des informations avec une requête simple. Vous créez des requêtes sur le contenu du modèle à l’aide de DMX. Vous pouvez également obtenir un type de contenu de modèle à l’aide des ensembles de lignes de schéma d’exploration de données.
Dans le contenu du modèle, la signification de chaque ligne ou nœud de la table retournée diffère selon le type d’algorithme utilisé pour générer le modèle, ainsi que le type de données de la colonne. Pour plus d’informations, consultez Requêtes de contenu (exploration de données).
Spécifications
Avant de pouvoir créer une requête sur un modèle, le modèle d’exploration de données doit avoir été traité. Le traitement des objets Analysis Services nécessite des autorisations spéciales. Pour plus d’informations sur le traitement des modèles d’exploration de données, consultez Exigences et considérations relatives au traitement (exploration de données).
Pour exécuter des requêtes sur un modèle d’exploration de données, vous devez disposer de différents niveaux d’autorisations, en fonction du type de requête que vous exécutez. Par exemple, l’exploration approfondie des données de cas ou de structure nécessite généralement des autorisations supplémentaires qui peuvent être définies sur l'objet de structure d’exploration de données ou l'objet de modèle d’exploration de données.
Toutefois, si votre requête utilise des données externes et inclut des instructions telles que OPENROWSET ou OPENQUERY, la base de données que vous interrogez doit activer ces instructions et vous devez disposer d’autorisations sur les objets de base de données sous-jacents.
Pour plus d’informations sur les contextes de sécurité requis pour exécuter des requêtes d’exploration de données, consultez Vue d’ensemble de la sécurité (Exploration de données)
Dans cette section
Les sujets de cette section présentent chaque type de requête d’exploration de données plus en détail et fournissent des liens vers des exemples détaillés de création de requêtes sur des modèles d'exploration de données.
Requêtes de prédiction (exploration de données)
Requêtes de contenu (exploration de données)
Requêtes de forage (exploration de données)
Requêtes de définition de données (exploration de données)
Interfaces de requête d’exploration de données
Tâches associées
Utilisez ces liens pour apprendre à créer et à utiliser des requêtes d’exploration de données.
Voir aussi
Algorithmes d’exploration de données (Analysis Services - Exploration de données)
Contenu du modèle d’exploration de données (Analysis Services - Exploration de données)