Partager via


Contenu du modèle d’exploration de données pour les modèles de réseau neuronal (Analysis Services - Exploration de données)

Cette rubrique décrit le contenu du modèle d’exploration de données spécifique aux modèles qui utilisent l’algorithme Microsoft Neural Network. Pour obtenir une explication sur l’interprétation des statistiques et de la structure partagées par tous les types de modèles et les définitions générales des termes liés au contenu du modèle d’exploration de données, consultez Le contenu du modèle d’exploration de données (Analysis Services - Exploration de données).

Présentation de la structure d’un modèle de réseau neuronal

Chaque modèle de réseau neuronal a un nœud parent unique qui représente le modèle et ses métadonnées, ainsi qu’un nœud de statistiques marginales (NODE_TYPE = 24) qui fournit des statistiques descriptives sur les attributs d’entrée. Le nœud de statistiques marginales est utile, car il récapitule les informations sur les entrées, afin que vous n’ayez pas besoin d’interroger des données à partir des nœuds individuels.

Sous ces deux nœuds, il y a au moins deux nœuds supplémentaires et peut être beaucoup plus, en fonction du nombre d’attributs prédictibles dont dispose le modèle.

  • Le premier nœud (NODE_TYPE = 18) représente toujours le nœud supérieur de la couche d’entrée. Sous ce nœud supérieur, vous pouvez trouver des nœuds d’entrée (NODE_TYPE = 21) qui contiennent les attributs d’entrée réels et leurs valeurs.

  • Les nœuds successifs contiennent chacun un sous-réseau différent (NODE_TYPE = 17). Chaque sous-réseau contient toujours une couche masquée (NODE_TYPE = 19) et une couche de sortie (NODE_TYPE = 20) pour ce sous-réseau.

structure du contenu du modèle pour les réseaux neuronaux

Les informations de la couche d’entrée sont simples : le nœud supérieur de chaque couche d’entrée (NODE_TYPE = 18) sert d’organisateur pour une collection de nœuds d’entrée (NODE_TYPE = 21). Le contenu des nœuds d’entrée est décrit dans le tableau suivant.

Chaque sous-réseau (NODE_TYPE = 17) représente l’analyse de l’influence de la couche d’entrée sur un attribut prévisible particulier. S’il existe plusieurs sorties prévisibles, il existe plusieurs sous-réseaux. La couche masquée de chaque sous-réseau contient plusieurs nœuds masqués (NODE_TYPE = 22) qui contiennent des détails sur les pondérations de chaque transition qui se termine par ce nœud masqué particulier.

La couche de sortie (NODE_TYPE = 20) contient des nœuds de sortie (NODE_TYPE = 23) qui contiennent chacune des valeurs distinctes de l’attribut prédictible. Si l’attribut prédictible est un type de données numérique continu, il n’existe qu’un seul nœud de sortie pour l’attribut.

Remarque

L’algorithme de régression logistique utilise un cas spécial d’un réseau neuronal qui n’a qu’un résultat prévisible et potentiellement de nombreuses entrées. La régression logistique n’utilise pas de couche masquée.

Le moyen le plus simple d’explorer la structure des entrées et des sous-réseaux consiste à utiliser la visionneuse de l’arborescence de contenu générique Microsoft. Vous pouvez cliquer sur n’importe quel nœud pour le développer et voir les nœuds enfants, ou afficher les pondérations et d’autres statistiques contenues dans le nœud.

Pour utiliser les données et voir comment le modèle met en corrélation les entrées avec les sorties, utilisez la visionneuse de réseau neuronal Microsoft. À l’aide de cette visionneuse personnalisée, vous pouvez filtrer sur les attributs d’entrée et leurs valeurs, et voir graphiquement comment ils affectent les sorties. Les info-bulles de la visionneuse affichent la probabilité et l’élévation associées à chaque paire d’entrées et de valeurs de sortie. Pour plus d’informations, consultez Parcourir un modèle à l’aide de la visionneuse de réseau neuronal Microsoft.

Contenu de modèle pour un modèle de réseau neuronal

Cette section fournit des détails et des exemples uniquement pour ces colonnes dans le contenu du modèle d’exploration de données qui ont une pertinence particulière pour les réseaux neuronaux. Pour plus d’informations sur les colonnes à usage général dans l’ensemble de lignes de schéma, telles que MODEL_CATALOG et MODEL_NAME, qui ne sont pas décrites ici, ou pour des explications de la terminologie du modèle d’exploration de données, consultez Contenu du modèle d’exploration de données (Analysis Services - Exploration de données).

CATALOGUE DE MODÈLES
Nom de la base de données où le modèle est stocké.

MODEL_NAME
Nom du modèle.

Nom_d’Attribut
Noms des attributs qui correspondent à ce nœud.

Nœud Contenu
Racine du modèle Vide
Statistiques marginales Vide
Couche d’entrée Vide
Nœud d’entrée Nom de l’attribut d’entrée
Couche masquée Vide
Nœud masqué Vide
Couche de sortie Vide
Nœud de sortie Nom de l’attribut de sortie

NODE_NAME
Nom du nœud. Cette colonne contient la même valeur que NODE_UNIQUE_NAME.

NODE_UNIQUE_NAME
Nom unique du nœud.

Pour plus d’informations sur la façon dont les noms et LES ID fournissent des informations structurelles sur le modèle, consultez la section Using Node Names and IDs.

NODE_TYPE
Un modèle de réseau neuronal génère les types de nœuds suivants :

ID de type de nœud Descriptif
1 Modèle.
17 Nœud organisateur pour le sous-réseau.
18 Nœud organisateur pour la couche d’entrée.
19 Nœud organisateur pour la couche masquée.
20 Nœud organisateur pour la couche de sortie.
Vingt-et-un Nœud d’attribut d’entrée.
22 Nœud de couche masqué
23 Nœud d’attribut de sortie.
24 Nœud de statistiques marginales.

NODE_CAPTION
Étiquette ou légende associée au nœud. Dans les modèles de réseau neuronal, toujours vides.

CARDINALITÉ_DES_ENFANTS
Estimation du nombre d’enfants dont dispose le nœud.

Nœud Contenu
Racine du modèle Indique le nombre de nœuds enfants, qui inclut au moins 1 réseau, 1 nœud marginal requis et 1 couche d’entrée requise. Par exemple, si la valeur est 5, il existe 3 sous-réseaux.
Statistiques marginales Toujours 0.
Couche d’entrée Indique le nombre de paires d’attributs d’entrée qui ont été utilisées par le modèle.
Nœud d’entrée Toujours 0.
Couche masquée Indique le nombre de nœuds masqués créés par le modèle.
Nœud masqué Toujours 0.
Couche de sortie Indique le nombre de valeurs de sortie.
Nœud de sortie Toujours 0.

NOM_UNIQUE_PARENT
Nom unique du parent du nœud. NULL est retourné pour tous les nœuds au niveau racine.

Pour plus d’informations sur la façon dont les noms et LES ID fournissent des informations structurelles sur le modèle, consultez la section Using Node Names and IDs.

DESCRIPTION_DU_NŒUD
Description conviviale du nœud.

Nœud Contenu
Racine du modèle Vide
Statistiques marginales Vide
Couche d’entrée Vide
Nœud d’entrée Nom de l’attribut d’entrée
Couche masquée Vide
Nœud masqué Entier qui indique la séquence du nœud masqué dans la liste des nœuds masqués.
Couche de sortie Vide
Nœud de sortie Si l’attribut de sortie est continu, contient le nom de l’attribut de sortie.

Si l’attribut de sortie est discret ou discrétisé, contient le nom de l’attribut et la valeur.

RÈGLE_NOEUD
Description XML de la règle incorporée dans le nœud.

Nœud Contenu
Racine du modèle Vide
Statistiques marginales Vide
Couche d’entrée Vide
Nœud d’entrée Fragment XML qui contient les mêmes informations que la colonne NODE_DESCRIPTION.
Couche masquée Vide
Nœud masqué Entier qui indique la séquence du nœud masqué dans la liste des nœuds masqués.
Couche de sortie Vide
Nœud de sortie Fragment XML qui contient les mêmes informations que la colonne NODE_DESCRIPTION.

RÈGLE_MARGINALE
Pour les modèles de réseau neuronal, toujours vide.

PROBABILITÉ_NŒUD
Probabilité associée à ce nœud. Pour les modèles de réseau neuronal, toujours 0.

PROBABILITÉ MARGINALE
Probabilité d’atteindre le nœud à partir du nœud parent. Pour les modèles de réseau neuronal, toujours 0.

DISTRIBUTION_DES_NŒUDS
Table imbriquée qui contient des informations statistiques pour le nœud. Pour plus d’informations sur le contenu de cette table pour chaque type de nœud, consultez la section Présentation de la table NODE_DISTRIBUTION.

NODE_SUPPORT
Pour les modèles de réseau neuronal, toujours 0.

Remarque

Les probabilités de prise en charge sont toujours 0, car la sortie de ce type de modèle n’est pas probabiliste. Seules les pondérations sont significatives pour l’algorithme ; par conséquent, l’algorithme ne calcule pas la probabilité, la prise en charge ou la variance.

Pour obtenir des informations sur la prise en charge dans les cas d’apprentissage pour des valeurs spécifiques, consultez le nœud de statistiques marginales.

MSOLAP_MODEL_COLUMN
|Nœud |Contenu |
|----------|-------------|
|Racine du modèle|Espace vide|
|Statistiques marginales|Vide|
|Couche d’entrée |Vide|
|Nœud d’entrée |Nom de l’attribut d’entrée.|
|Couche cachée|Vide|
|Nœud masqué |Vide|
|Couche de sortie |Vide|
|Nœud de sortie |Nom de l’attribut d’entrée.|

MSOLAP_NODE_SCORE
Pour un modèle de réseau neuronal, toujours 0.

MSOLAP_NODE_SHORT_CAPTION
Pour les modèles de réseau neuronal, toujours vide.

Remarques

L’objectif de l’apprentissage d’un modèle de réseau neuronal consiste à déterminer les pondérations associées à chaque transition d’une entrée à un point intermédiaire, et d’un point intermédiaire à un point de terminaison. Par conséquent, la couche d’entrée du modèle existe principalement pour stocker les valeurs réelles utilisées pour générer le modèle. La couche masquée stocke les pondérations calculées et fournit des pointeurs vers les attributs d’entrée. La couche de sortie stocke les valeurs prévisibles et fournit également des pointeurs vers les points intermédiaires de la couche masquée.

Utilisation des noms de nœuds et des ID

Le nommage des nœuds dans un modèle de réseau neuronal fournit des informations supplémentaires sur le type de nœud, afin de faciliter la liaison de la couche masquée à la couche d’entrée et de la couche de sortie à la couche masquée. Le tableau suivant présente la convention pour les ID affectés aux nœuds de chaque couche.

Type de nœud Convention pour l’ID de nœud
Racine du modèle (1) 00000000000000000.
Nœud de statistiques marginales (24) 10000000000000000
Couche d’entrée (18) 30000000000000000
Nœud d’entrée (21) Commence à 60 000 000 000 000 000
Sous-réseau (17) 20000000000000000
Couche masquée (19) 40000000000000000
Nœud masqué (22) Commence à 700000000000000000
Couche de sortie (20) 50000000000000000
Nœud de sortie (23) Commence à 800000000000000000

Vous pouvez déterminer quels attributs d’entrée sont liés à un nœud de couche masqué spécifique en consultant la table NODE_DISTRIBUTION dans le nœud masqué (NODE_TYPE = 22). Chaque ligne de la table NODE_DISTRIBUTION contient l’ID d’un nœud d’attribut d’entrée.

De même, vous pouvez déterminer les couches masquées liées à un attribut de sortie en affichant la table NODE_DISTRIBUTION dans le nœud de sortie (NODE_TYPE = 23). Chaque ligne de la table NODE_DISTRIBUTION contient l’ID d’un nœud de couche masqué, ainsi que le coefficient associé.

Interprétation des informations dans la table NODE_DISTRIBUTION

La table NODE_DISTRIBUTION peut être vide dans certains nœuds. Toutefois, pour les nœuds d’entrée, les nœuds de couche masqués et les nœuds de sortie, la table NODE_DISTRIBUTION stocke des informations importantes et intéressantes sur le modèle. Pour vous aider à interpréter ces informations, la table NODE_DISTRIBUTION contient une colonne VALUETYPE pour chaque ligne qui vous indique si la valeur de la colonne ATTRIBUTE_VALUE est discrète (4), discrétisée (5) ou continue (3).

Nœuds d’entrée

La couche d’entrée contient un nœud pour chaque valeur de l’attribut utilisé dans le modèle.

Attribut discret : Le nœud d’entrée stocke uniquement le nom de l’attribut et sa valeur dans les colonnes ATTRIBUTE_NAME et ATTRIBUTE_VALUE. Par exemple, si [Work Shift] est la colonne, un nœud distinct est créé pour chaque valeur de cette colonne utilisée dans le modèle, telle que AM et PM. La table NODE_DISTRIBUTION pour chaque nœud répertorie uniquement la valeur actuelle de l’attribut.

Attribut numérique discrétisé : Le nœud d’entrée stocke le nom de l’attribut et la valeur, qui peut être une plage ou une valeur spécifique. Toutes les valeurs sont représentées par des expressions, telles que « 77.4 - 87.4 » ou « < 64.0 » pour la valeur de [Time Per Issue]. La table NODE_DISTRIBUTION pour chaque nœud répertorie uniquement la valeur actuelle de l’attribut.

Attribut continu : Le nœud d’entrée stocke la valeur moyenne de l’attribut. La table NODE_DISTRIBUTION pour chaque nœud répertorie uniquement la valeur actuelle de l’attribut.

Nœuds de couche masqués

La couche masquée contient un nombre variable de nœuds. Dans chaque nœud, la table NODE_DISTRIBUTION contient des mappages de la couche masquée aux nœuds de la couche d’entrée. La colonne ATTRIBUTE_NAME contient un ID de nœud qui correspond à un nœud dans la couche d’entrée. La colonne ATTRIBUTE_VALUE contient le poids associé à cette combinaison de nœud d’entrée et de nœud de couche masqué. La dernière ligne de la table contient un coefficient qui représente le poids de ce nœud masqué dans la couche masquée.

Nœuds de sortie

La couche de sortie contient un nœud de sortie pour chaque valeur de sortie utilisée dans le modèle. Dans chaque nœud, la table NODE_DISTRIBUTION contient des mappages de la couche de sortie aux nœuds de la couche masquée. La colonne ATTRIBUTE_NAME contient un ID de nœud qui correspond à un nœud dans la couche masquée. La colonne ATTRIBUTE_VALUE contient le poids associé à cette combinaison de nœud de sortie et de nœud de couche masqué.

La table NODE_DISTRIBUTION contient les informations supplémentaires suivantes, selon que le type de l’attribut :

Attribut discret : Les deux dernières lignes de la table NODE_DISTRIBUTION contiennent un coefficient pour le nœud dans son ensemble et la valeur actuelle de l’attribut.

Attribut numérique discrétisé : Identique aux attributs discrets, sauf que la valeur de l’attribut est une plage de valeurs.

Attribut continu : Les deux dernières lignes de la table NODE_DISTRIBUTION contiennent la moyenne de l’attribut, le coefficient du nœud dans son ensemble et la variance du coefficient.

Voir aussi

Algorithme de réseau neuronal Microsoft
Informations techniques de référence sur l’algorithme de réseau neuronal Microsoft
Exemples de requête de modèle de réseau neuronal