Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cette rubrique décrit le contenu du modèle d’exploration de données spécifique aux modèles qui utilisent l’algorithme Microsoft Logistic Regression. Pour obtenir une explication sur l’interprétation des statistiques et de la structure partagées par tous les types de modèles et les définitions générales des termes liés au contenu du modèle d’exploration de données, consultez Le contenu du modèle d’exploration de données (Analysis Services - Exploration de données).
Présentation de la structure d’un modèle de régression logistique
Un modèle de régression logistique est créé à l’aide de l’algorithme Microsoft Neural Network avec des paramètres qui limitent le modèle pour éliminer le nœud masqué. Par conséquent, la structure globale d’un modèle de régression logistique est presque identique à celle d’un réseau neuronal : chaque modèle a un nœud parent unique qui représente le modèle et ses métadonnées, et un nœud de statistiques marginales spécial (NODE_TYPE = 24) qui fournit des statistiques descriptives sur les entrées utilisées dans le modèle.
En outre, le modèle contient un sous-réseau (NODE_TYPE = 17) pour chaque attribut prédictible. Tout comme dans un modèle de réseau neuronal, chaque sous-réseau contient toujours deux branches : une pour la couche d’entrée et une autre branche qui contient la couche masquée (NODE_TYPE = 19) et la couche de sortie (NODE_TYPE = 20) pour le réseau. Le même sous-réseau peut être utilisé pour plusieurs attributs s’ils sont spécifiés comme prédictifs uniquement. Les attributs prévisibles qui sont également des entrées peuvent ne pas apparaître dans le même sous-réseau.
Toutefois, dans un modèle de régression logistique, le nœud qui représente la couche masquée est vide et n’a pas d’enfants. Par conséquent, le modèle contient des nœuds qui représentent des sorties individuelles (NODE_TYPE = 23) et des entrées individuelles (NODE_TYPE = 21), mais pas de nœuds masqués individuels.
Par défaut, un modèle de régression logistique s’affiche dans la visionneuse de réseau neuronal Microsoft. Avec cette visionneuse personnalisée, vous pouvez filtrer sur les attributs d’entrée et leurs valeurs, et voir graphiquement comment ils affectent les sorties. Les info-bulles de la visionneuse affichent la probabilité et l’élévation associées à chaque paire d’entrées et de valeurs de sortie. Pour plus d’informations, consultez Parcourir un modèle à l’aide de la visionneuse de réseau neuronal Microsoft.
Pour explorer la structure des entrées et des sous-réseaux, et pour afficher des statistiques détaillées, vous pouvez utiliser la visionneuse de l’arborescence de contenu générique Microsoft. Vous pouvez cliquer sur n’importe quel nœud pour le développer et voir les nœuds enfants, ou afficher les pondérations et d’autres statistiques contenues dans le nœud.
Contenu du modèle pour un modèle de régression logistique
Cette section fournit des détails et des exemples uniquement pour les colonnes du contenu du modèle d'exploration de données qui ont une pertinence particulière pour la régression logistique. Le contenu du modèle est presque identique à celui d’un modèle de réseau neuronal, mais les descriptions qui s’appliquent aux modèles de réseau neuronal peuvent être répétées dans ce tableau pour des raisons pratiques.
Pour plus d’informations sur les colonnes à usage général dans l’ensemble de lignes de schéma, telles que MODEL_CATALOG et MODEL_NAME, qui ne sont pas décrites ici, ou pour des explications de la terminologie du modèle d’exploration de données, consultez Contenu du modèle d’exploration de données (Analysis Services - Exploration de données).
CATALOGUE DE MODÈLES
Nom de la base de données où le modèle est stocké.
MODEL_NAME
Nom du modèle.
Nom_d’Attribut
Noms de l’attribut qui correspond à ce nœud.
| Nœud | Contenu |
|---|---|
| Racine du modèle | Vide |
| Statistiques marginales | Vide |
| Couche d’entrée | Vide |
| Nœud d’entrée | Nom de l’attribut d’entrée |
| Couche masquée | Vide |
| Couche de sortie | Vide |
| Nœud de sortie | Nom de l’attribut de sortie |
NODE_NAME
Nom du nœud. Actuellement, cette colonne contient la même valeur que NODE_UNIQUE_NAME, bien que cela puisse changer dans les versions ultérieures.
NODE_UNIQUE_NAME
Nom unique du nœud.
Pour plus d’informations sur la façon dont les noms et LES ID fournissent des informations structurelles sur le modèle, consultez la section Using Node Names and IDs.
NODE_TYPE
Un modèle de régression logistique génère les types de nœuds suivants :
| ID de type de nœud | Descriptif |
|---|---|
| 1 | Modèle. |
| 17 | Nœud organisateur pour le sous-réseau. |
| 18 | Nœud organisateur pour la couche d’entrée. |
| 19 | Nœud organisateur pour la couche masquée. La couche masquée est vide. |
| 20 | Nœud organisateur pour la couche de sortie. |
| Vingt-et-un | Nœud d’attribut d’entrée. |
| 23 | Nœud d’attribut de sortie. |
| 24 | Nœud de statistiques marginales. |
NODE_CAPTION
Étiquette ou légende associée au nœud. Dans les modèles de régression logistique, toujours en blanc.
CARDINALITÉ_DES_ENFANTS
Estimation du nombre d’enfants dont dispose le nœud.
| Nœud | Contenu |
|---|---|
| Racine du modèle | Indique le nombre de nœuds enfants, qui inclut au moins 1 réseau, 1 nœud marginal requis et 1 couche d’entrée requise. Par exemple, si la valeur est 5, il existe 3 sous-réseaux. |
| Statistiques marginales | Toujours 0. |
| Couche d’entrée | Indique le nombre de paires d’attributs d’entrée qui ont été utilisées par le modèle. |
| Nœud d’entrée | Toujours 0. |
| Couche masquée | Dans un modèle de régression logistique, toujours 0. |
| Couche de sortie | Indique le nombre de valeurs de sortie. |
| Nœud de sortie | Toujours 0. |
NOM_UNIQUE_PARENT
Nom unique du parent du nœud. NULL est retourné pour tous les nœuds au niveau racine.
Pour plus d’informations sur la façon dont les noms et LES ID fournissent des informations structurelles sur le modèle, consultez la section Using Node Names and IDs.
DESCRIPTION_DU_NŒUD
Description conviviale du nœud.
| Nœud | Contenu |
|---|---|
| Racine du modèle | Vide |
| Statistiques marginales | Vide |
| Couche d’entrée | Vide |
| Nœud d’entrée | Nom de l’attribut d’entrée |
| Couche masquée | Vide |
| Couche de sortie | Vide |
| Nœud de sortie | Si l’attribut de sortie est continu, contient le nom de l’attribut de sortie. Si l’attribut de sortie est discret ou discrétisé, contient le nom de l’attribut et la valeur. |
RÈGLE_NOEUD
Description XML de la règle incorporée dans le nœud.
| Nœud | Contenu |
|---|---|
| Racine du modèle | Vide |
| Statistiques marginales | Vide |
| Couche d’entrée | Vide |
| Nœud d’entrée | Fragment XML contenant les mêmes informations que la colonne NODE_DESCRIPTION. |
| Couche masquée | Vide |
| Couche de sortie | Vide |
| Nœud de sortie | Fragment XML contenant les mêmes informations que la colonne NODE_DESCRIPTION. |
RÈGLE_MARGINALE
Pour les modèles de régression logistique, toujours vides.
PROBABILITÉ_NŒUD
Probabilité associée à ce nœud. Pour les modèles de régression logistique, toujours 0.
PROBABILITÉ MARGINALE
Probabilité d’atteindre le nœud à partir du nœud parent. Pour les modèles de régression logistique, toujours 0.
DISTRIBUTION_DES_NŒUDS
Table imbriquée qui contient des informations statistiques pour le nœud. Pour plus d’informations sur le contenu de cette table pour chaque type de nœud, consultez la section Présentation de la table NODE_DISTRIBUTION, dans le contenu du modèle d’exploration de données pour les modèles de réseau neuronal (Analysis Services - Exploration de données) .
NODE_SUPPORT
Pour les modèles de régression logistique, toujours 0.
Remarque
Les probabilités de prise en charge sont toujours 0, car la sortie de ce type de modèle n’est pas probabiliste. La seule chose qui est significative pour l’algorithme est les poids ; par conséquent, l’algorithme ne calcule pas la probabilité, la prise en charge ou la variance.
Pour obtenir des informations sur la prise en charge dans les cas d’apprentissage pour des valeurs spécifiques, consultez le nœud de statistiques marginales.
MSOLAP_MODEL_COLUMN
|Nœud |Contenu |
|----------|-------------|
|Racine du modèle|Espace vide|
|Statistiques marginales|Vide|
|Couche d’entrée |Vide|
|Nœud d’entrée |Nom de l’attribut d’entrée.|
|Couche cachée|Vide|
|Couche de sortie |Vide|
|Nœud de sortie |Nom de l’attribut d’entrée.|
MSOLAP_NODE_SCORE
Dans les modèles de régression logistique, toujours 0.
MSOLAP_NODE_SHORT_CAPTION
Dans les modèles de régression logistique, toujours vide.
Utilisation des noms de nœuds et des ID
Le nommage des nœuds dans un modèle de régression logistique fournit des informations supplémentaires sur les relations entre les nœuds du modèle. Le tableau suivant présente les conventions relatives aux ID affectés aux nœuds de chaque couche.
| Type de nœud | Convention pour l’ID de nœud |
|---|---|
| Racine du modèle (1) | 00000000000000000. |
| Nœud de statistiques marginales (24) | 10000000000000000 |
| Couche d’entrée (18) | 30000000000000000 |
| Nœud d’entrée (21) | Commence à 60 000 000 000 000 000 |
| Sous-réseau (17) | 20000000000000000 |
| Couche masquée (19) | 40000000000000000 |
| Couche de sortie (20) | 50000000000000000 |
| Nœud de sortie (23) | Commence à 800000000000000000 |
Vous pouvez utiliser ces ID pour déterminer comment les attributs de sortie sont liés à des attributs de couche d’entrée spécifiques, en consultant la table NODE_DISTRIBUTION du nœud de sortie. Chaque ligne de cette table contient un ID qui pointe vers un nœud d’attribut d’entrée spécifique. La table NODE_DISTRIBUTION contient également le coefficient de cette paire d’entrée-sortie.
Voir aussi
Algorithme de régression logistique Microsoft
Contenu du modèle d’exploration de données pour les modèles de réseau neuronal (Analysis Services - Exploration de données)
Exemples de requête de modèle de régression logistique
Informations techniques de référence sur l’algorithme de régression logistique Microsoft