Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Lorsque vous créez une requête sur un modèle d’exploration de données, vous pouvez créer une requête de contenu, qui fournit des détails sur les modèles découverts dans l’analyse ou une requête de prédiction, qui utilise les modèles du modèle pour effectuer des prédictions pour les nouvelles données. Par exemple, une requête de contenu pour un modèle de réseau neuronal peut récupérer des métadonnées de modèle telles que le nombre de couches masquées. Une requête de prédiction pourrait suggérer des classifications basées sur une entrée et éventuellement fournir les probabilités pour chaque classification.
Cette section explique comment créer des requêtes pour des modèles basés sur l’algorithme Microsoft Neural Network.
Requêtes de contenu
Obtention de métadonnées de modèle à l’aide de DMX
Récupération des métadonnées de modèle à partir de l’ensemble de lignes de schéma
Récupération des attributs d’entrée pour le modèle
Récupération des poids à partir de la couche cachée
Requêtes de prédiction
Création d’une prédiction Singleton
Recherche d’informations sur un modèle de réseau neuronal
Tous les modèles d’exploration de données exposent le contenu appris par l’algorithme en fonction d’un schéma standardisé, l’ensemble de lignes de schéma du modèle d’exploration de données. Ces informations fournissent des détails sur le modèle et incluent les métadonnées de base, les structures découvertes dans l’analyse et les paramètres utilisés lors du traitement. Vous pouvez créer des requêtes sur le contenu du modèle à l’aide d’instructions DMX (Data Mining Extension).
Exemple de requête 1 : obtention de métadonnées de modèle à l’aide de DMX
La requête suivante retourne des métadonnées de base sur un modèle créé à l’aide de l’algorithme Microsoft Neural Network. Dans un modèle de réseau neuronal, le nœud parent du modèle contient uniquement le nom du modèle, le nom de la base de données où le modèle est stocké et le nombre de nœuds enfants. Toutefois, le nœud de statistiques marginales (NODE_TYPE = 24) fournit à la fois ces métadonnées de base et certaines statistiques dérivées sur les colonnes d’entrée utilisées dans le modèle.
L’exemple de requête suivant est basé sur le modèle d’exploration de données que vous créez dans le didacticiel d’exploration de données intermédiaire, nommé Call Center Default NN. Le modèle utilise des données d’un centre d’appels pour explorer les corrélations possibles entre le personnel et le nombre d’appels, de commandes et de problèmes. L’instruction DMX récupère les données du nœud de statistiques marginales du modèle de réseau neuronal. La requête inclut le mot clé FLATTENED, car les statistiques d’attribut d’entrée d’intérêt sont stockées dans une table imbriquée, NODE_DISTRIBUTION. Toutefois, si votre fournisseur de requêtes prend en charge les ensembles de lignes hiérarchiques, vous n’avez pas besoin d’utiliser le mot clé FLATTENED.
SELECT FLATTENED MODEL_CATALOG, MODEL_NAME,
( SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE,
[SUPPORT], [PROBABILITY], VALUETYPE
FROM NODE_DISTRIBUTION
) AS t
FROM [Call Center Default NN].CONTENT
WHERE NODE_TYPE = 24
Remarque
Vous devez placer le nom des colonnes [SUPPORT] de table imbriquées et [PROBABILITY] entre crochets pour les distinguer des mots clés réservés du même nom.
Résultats de l'exemple :
| CATALOGUE DE MODÈLES | MODEL_NAME | t.ATTRIBUTE_NAME | t.ATTRIBUTE_VALUE | t.SUPPORT | t.PROBABILITÉ | t.VALUETYPE |
|---|---|---|---|---|---|---|
| Adventure Works DW Multidimensional 2012 | Centre d’appels NN | Temps moyen par problème | Manquant | 0 | 0 | 1 |
| Adventure Works DW Multidimensionnel 2012 | Centre d’appels NN | Temps moyen par problème | < 64.7094100096 | 11 | 0.407407407 | 5 |
Pour obtenir une définition de ce que signifient les colonnes de l’ensemble de lignes de schéma dans le contexte d’un modèle de réseau neuronal, consultez Contenu du modèle d’exploration de données pour les modèles de réseau neuronal (Analysis Services - Exploration de données).
Exemple de requête 2 : récupération des métadonnées de modèle à partir de l’ensemble de lignes de schéma
Vous trouverez les mêmes informations que celles retournées dans une requête de contenu DMX en interrogeant l’ensemble de lignes du schéma d’exploration de données. Toutefois, l’ensemble de lignes de schéma fournit des colonnes supplémentaires. L’exemple de requête suivant retourne la date à laquelle le modèle a été créé, la date à laquelle il a été modifié et la date à laquelle le modèle a été traité pour la dernière fois. La requête retourne également les colonnes prévisibles, qui ne sont pas facilement disponibles à partir du contenu du modèle et les paramètres utilisés pour générer le modèle. Ces informations peuvent être utiles pour documenter le modèle.
SELECT MODEL_NAME, DATE_CREATED, LAST_PROCESSED, PREDICTION_ENTITY, MINING_PARAMETERS
from $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Call Center Default NN'
Résultats de l'exemple :
| MODEL_NAME | NN par défaut du centre d’appels |
| Date de création | 1/10/2008 5:07:38 PM |
| DERNIER_TRAITÉ | 1/10/2008 5:24:02 PM |
| PREDICTION_ENTITY | Temps moyen par problème, Grade de service, Nombre de commandes |
| PARAMÈTRES_MINIERS | HOLDOUT_PERCENTAGE=30, HOLDOUT_SEED=0 MAXIMUM_INPUT_ATTRIBUTES=255, MAXIMUM_OUTPUT_ATTRIBUTES=255, MAXIMUM_STATES=100, SAMPLE_SIZE=10000, HIDDEN_NODE_RATIO=4 |
Exemple de requête 3 : Récupération des attributs d’entrée pour le modèle
Vous pouvez récupérer les paires attribut-valeur d’entrée utilisées pour créer le modèle en interrogeant les nœuds enfants (NODE_TYPE = 20) de la couche d’entrée (NODE_TYPE = 18). La requête suivante retourne une liste d’attributs d’entrée à partir des descriptions de nœud.
SELECT NODE_DESCRIPTION
FROM [Call Center Default NN].CONTENT
WHERE NODE_TYPE = 2
Résultats de l'exemple :
| DESCRIPTION_DU_NŒUD |
|---|
| Durée moyenne par problème =64,7094100096 - 77,4002099712 |
| Jour de la semaine=fri. |
| Opérateurs de niveau 1 |
Seuls quelques lignes représentatives des résultats sont affichées ici. Toutefois, vous pouvez voir que le NODE_DESCRIPTION fournit des informations légèrement différentes en fonction du type de données de l’attribut d’entrée.
Si l’attribut est une valeur discrète ou discrétisée, l’attribut et sa valeur ou sa plage discrétisée sont retournées.
Si l’attribut est un type de données numérique continu, le NODE_DESCRIPTION contient uniquement le nom de l’attribut. Toutefois, vous pouvez récupérer la table NODE_DISTRIBUTION imbriquée pour obtenir la moyenne, ou renvoyer le NODE_RULE pour obtenir les valeurs minimales et maximales de la plage numérique.
La requête suivante montre comment interroger la table NODE_DISTRIBUTION imbriquée pour retourner les attributs d’une colonne et leurs valeurs dans une autre colonne. Pour les attributs continus, la valeur de l’attribut est représentée par sa moyenne.
SELECT FLATTENED
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE
FROM NODE_DISTRIBUTION) as t
FROM [Call Center Default NN -- Predict Service and Orders].CONTENT
WHERE NODE_TYPE = 21
Résultats de l'exemple :
| t.ATTRIBUTE_NAME | t.ATTRIBUTE_VALUE |
|---|---|
| Temps moyen par problème | 64.7094100096 - 77.4002099712 |
| Jour de la semaine | Ven. |
| Opérateurs de niveau 1 | 3,2962962962963 |
Les valeurs de plage minimale et maximale sont stockées dans la colonne NODE_RULE et sont représentées sous forme de fragment XML, comme illustré dans l’exemple suivant :
<NormContinuous field="Level 1 Operators">
<LinearNorm orig="2.83967303681711" norm="-1" />
<LinearNorm orig="3.75291955577548" norm="1" />
</NormContinuous>
Exemple de requête 4 : Récupération des pondérations à partir de la couche masquée
Le contenu du modèle d’un modèle de réseau neuronal est structuré de manière à faciliter la récupération des détails sur n’importe quel nœud du réseau. De plus, les numéros d’ID des nœuds fournissent des informations qui vous aident à identifier les relations entre les types de nœuds.
La requête suivante montre comment récupérer les coefficients stockés sous un nœud particulier de la couche masquée. La couche masquée se compose d’un nœud organisateur (NODE_TYPE = 19), qui contient uniquement des métadonnées et plusieurs nœuds enfants (NODE_TYPE = 22), qui contiennent les coefficients des différentes combinaisons d’attributs et de valeurs. Cette requête retourne uniquement les nœuds de coefficient.
SELECT FLATTENED TOP 1 NODE_UNIQUE_NAME,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, VALUETYPE
FROM NODE_DISTRIBUTION) as t
FROM [Call Center Default NN -- Predict Service and Orders].CONTENT
WHERE NODE_TYPE = 22
AND [PARENT_UNIQUE_NAME] = '40000000200000000' FROM [Call Center Default NN].CONTENT
Résultats de l'exemple :
| NODE_UNIQUE_NAME | t.ATTRIBUTE_NAME | t.ATTRIBUTE_VALUE | t.VALUETYPE |
|---|---|---|---|
| 70000000200000000 | 6000000000000000a | -0.178616518 | 7 |
| 70000000200000000 | 6000000000000000b | -0.267561918 | 7 |
| 70000000200000000 | 6000000000000000c | 0.11069497 | 7 |
| 70000000200000000 | 6000000000000000d | 0.123757712 | 7 |
| 70000000200000000 | 6000000000000000e | 0.294565343 | 7 |
| 70000000200000000 | 6000000000000000f | 0.22245318 | 7 |
| 70000000200000000 | 0.188805045 | 7 |
Les résultats partiels présentés ici montrent comment le contenu du modèle de réseau neuronal associe le nœud masqué aux nœuds d’entrée.
Les noms uniques des nœuds de la couche masquée commencent toujours par 700000000.
Les noms uniques des nœuds dans la couche d’entrée commencent toujours par 600000000.
Ainsi, ces résultats vous indiquent que le nœud indiqué par l’ID 70000000200000000 avait six coefficients différents (VALUETYPE = 7) passés à celui-ci. Les valeurs des coefficients se trouvent dans la colonne ATTRIBUTE_VALUE. Vous pouvez déterminer exactement l’attribut d’entrée pour lequel le coefficient est utilisé à l’aide de l’ID de nœud dans la colonne ATTRIBUTE_NAME. Par exemple, l’ID de nœud 6000000000000000a fait référence à l’attribut et à la valeur d’entrée, Day of Week = 'Tue.' vous pouvez utiliser l’ID de nœud pour créer une requête, ou vous pouvez accéder au nœud à l’aide de la visionneuse de l’arborescence de contenu générique Microsoft.
De même, si vous interrogez la table NODE_DISTRIBUTION des nœuds dans la couche de sortie (NODE_TYPE = 23), vous pouvez voir les coefficients pour chaque valeur de sortie. Toutefois, dans la couche de sortie, les pointeurs font référence aux nœuds de la couche masquée. Pour plus d’informations, consultez Contenu du modèle d’exploration de données pour les modèles de réseau neuronal (Analysis Services - Exploration de données).
Utilisation d’un modèle de réseau neuronal pour effectuer des prédictions
L’algorithme Microsoft Neural Network prend en charge la classification et la régression. Vous pouvez utiliser des fonctions de prédiction avec ces modèles pour fournir de nouvelles données et créer des prédictions singleton ou batch.
Exemple de requête 5 : Création d’une prédiction Singleton
Le moyen le plus simple de créer une requête de prédiction sur un modèle de réseau neuronal consiste à utiliser le Générateur de requêtes de prédiction, disponible sous l’onglet Prédiction d’exploration de données du Concepteur d’exploration de données dans SQL Server Management Studio et SQL Server Data Tools (SSDT). Vous pouvez parcourir le modèle dans microsoft Neural Network Viewer pour filtrer les attributs d’intérêt et afficher les tendances, puis passer à l’onglet Prédiction d’exploration de données pour créer une requête et prédire de nouvelles valeurs pour ces tendances.
Par exemple, vous pouvez parcourir le modèle du centre d’appels pour afficher les corrélations entre les volumes de commande et d’autres attributs. Pour ce faire, ouvrez le modèle dans la visionneuse et, pour Entrée, sélectionnez <Tout>. Ensuite, pour Sortie, sélectionnez Nombre de commandes. Pour La valeur 1, sélectionnez la plage qui représente le plus de commandes et, pour la valeur 2, sélectionnez la plage qui représente les commandes les plus rares. Vous pouvez ensuite voir en un clin d’œil tous les attributs que le modèle met en corrélation avec le volume de commandes.
En parcourant les résultats de la visionneuse, vous constatez que certains jours de la semaine ont des volumes de commandes faibles et qu’une augmentation du nombre d’opérateurs semble être corrélée avec des ventes plus élevées. Vous pouvez ensuite utiliser une requête de prédiction sur le modèle pour tester une hypothèse « que si » et demander si l’augmentation du nombre d’opérateurs de niveau 2 sur une journée à faible volume augmenterait les commandes. Pour ce faire, créez une requête telle que la suivante :
SELECT Predict([Call Center Default NN].[Number of Orders]) AS [Predicted Orders],
PredictProbability([Call Center Default NN].[Number of Orders]) AS [Probability]
FROM [Call Center Default NN]
NATURAL PREDICTION JOIN
(SELECT 'Tue.' AS [Day of Week],
13 AS [Level 2 Operators]) AS t
Résultats de l'exemple :
| Commandes prédites | Probabilité |
|---|---|
| 364 | 0.9532... |
Le volume des ventes prédits est supérieur à la plage actuelle de ventes pour mardi, et la probabilité de la prédiction est très élevée. Toutefois, vous pouvez créer plusieurs prédictions à l’aide d’un processus de traitement par lots pour tester diverses hypothèses sur le modèle.
Remarque
Les assistants de régression logistique de Data Mining Add-Ins pour Excel 2007 facilitent la réponse à des questions complexes, telles que le nombre d’opérateurs de niveau deux nécessaires pour améliorer le degré de service à un niveau cible pour un quart de travail spécifique. Les compléments d’exploration de données sont un téléchargement gratuit et incluent des assistants basés sur les algorithmes de réseau neuronal et/ou de régression logistique. Pour plus d'informations, consultez le site Web des compléments d'exploration de données pour Office 2007.
Liste des fonctions de prédiction
Tous les algorithmes Microsoft prennent en charge un ensemble commun de fonctions. Il n’existe aucune fonction de prédiction spécifique à l’algorithme Microsoft Neural Network ; toutefois, l’algorithme prend en charge les fonctions répertoriées dans le tableau suivant.
| Fonction de prédiction | Utilisation |
| IsDescendant (DMX) | Détermine si un nœud est un enfant d’un autre nœud dans le graphe de réseau neuronal. |
| PredictAdjustedProbability (DMX) | Retourne la probabilité pondérée. |
| PredictHistogram (DMX) | Retourne une table de valeurs associée à la valeur prédite actuelle. |
| PredictVariance (DMX) | Retourne la variance de la valeur prédite. |
| PredictProbability (DMX) | Retourne la probabilité de la valeur prédite. |
| PredictStdev (DMX) | Retourne la déviance standard pour la valeur prédite. |
| PredictSupport (DMX) | Pour les modèles de réseau neuronal et de régression logistique, retourne une valeur unique qui représente la taille du jeu d’entraînement pour l’ensemble du modèle. |
Pour connaître la syntaxe des fonctions spécifiques, consultez La référence de fonction DMX (Data Mining Extensions).
Voir aussi
Algorithme de réseau neuronal Microsoft
Informations techniques de référence sur l’algorithme de réseau neuronal Microsoft
Contenu du modèle d’exploration de données pour les modèles de réseau neuronal (Analysis Services - Exploration de données)
Leçon 5 : Création de modèles de réseau neuronal et de régression logistique (didacticiel sur l’exploration de données intermédiaire)