Partager via


Navigation dans un modèle de réseau neuronal

Lorsque vous ouvrez un réseau neuronal ou un modèle de régression logistique à l’aide de Parcourir, le modèle s’affiche dans une visionneuse interactive, similaire à la visionneuse de modèle de réseau neuronal dans Analysis Services. La visionneuse vous aide à explorer les corrélations et à obtenir des informations sur les motifs du modèle ainsi que sur les données sous-jacentes.

Explorer le modèle

Les modèles basés sur les algorithmes Microsoft Neural Network ou Logistic Regression sont similaires dans le fait qu’ils analysent les données sous la forme d’un ensemble de connexions entre les entrées et sorties connues. Le visionneur Parcourir vous aide à explorer ces connexions, en utilisant les contrôles suivants :

Si vous souhaitez expérimenter cette visionneuse, vous pouvez créer un modèle à l’aide de l’Assistant Classifier (Compléments d’exploration de données pour Excel) et utiliser l’option Avancé pour modifier l’algorithme en régression logistique Microsoft dans la boîte de dialogue Paramètres d’algorithme .

Variables

Le volet Variables affiche une liste de variables d’entrée dans l’ordre de leur effet sur le modèle. Vous utilisez les contrôles d’entrée et de sortie pour filtrer le modèle, affectant les variables affichées, ainsi que leur ordre.

À l’aide de cette visionneuse, vous pouvez explorer les facteurs les plus importants pour déterminer si un client appartient plus probablement à la catégorie de l’acheteur de vélos ou à la catégorie non-acheteur.

Effet du test sur le résultat des attributs sélectionnés

Explorer les variables
  1. Initialement, le volet Variables est trié dans l’ordre des attributs les plus importants, en fonction des filtres actuels. La longueur de la barre indique la force du facteur.

    Dans l’exemple, vous pouvez voir que le revenu est le facteur le plus influent, suivi de la région. D’autre part, les clients avec beaucoup de voitures et beaucoup d’enfants sont très peu susceptibles d’acheter un vélo.

  2. Dans le volet Variables , cliquez sur l’en-tête de colonne de l’attribut.

    En triant sur l’attribut, vous pouvez voir les bacs qui ont été créés pour chacune des colonnes d’entrée. Les colonnes avec des valeurs discrètes, telles que l’occupation, sont binnées par les valeurs littérales.

  3. Notez les plages de valeurs qui ont été trouvées pour l’âge et le revenu.

    Si l’une de vos colonnes d’entrée sont des nombres (autrement dit, la colonne entière de données est un type de données numérique continu), les nombres sont regroupés ou compartimentés en plages discrètes.

    Pour le revenu, la colonne a été subdivisée en catégories telles que 78.4-154.06 (pour la tranche de revenus la plus haute).

    trier pour voir comment les variables ont été regroupées

    Si vous souhaitez des regroupements différents, vous devez utiliser l’outil Relabel (compléments d’exploration de données SQL Server) ou les fonctions Excel pour créer de nouvelles catégories de revenus avant de créer le modèle.

  4. Cliquez sur Faveurs Oui pour restaurer le graphique dans l’affichage par défaut.

    Par défaut, la vue est triée par la valeur de Favors pour la valeur du premier résultat. Vous pouvez modifier les résultats affectés aux premières et deuxième colonnes en choisissant une nouvelle valeur pour la valeur 1 et la valeur 2 dans la sortie.

  5. Faites une pause avec la souris sur la barre colorée en haut du graphique.

    Une info-bulle apparaît indiquant un score d’importance, une paire de scores de probabilité et une paire de valeurs d’élévation.

    • L’importance est calculée sur l’ensemble du jeu de données et identifie l’attribut qui, compte tenu de toutes les entrées, est le plus corrélé avec le résultat cible. La visionneuse trie les valeurs dans le graphique en fonction des scores d’importance.

    • La probabilité est calculée pour chaque ensemble de paires attribut-valeur, pour les résultats cibles, dans l’ensemble du jeu de données.

    • Lift vous indique comment cette paire attribut-valeur particulière est utile pour promouvoir un résultat ou un autre.

    Remarque : l’info-bulle contient les mêmes informations, que vous positioniez la souris sur une colonne ou l’autre.

Revenir en haut

Données d'entrée

Le volet Entrées vous permet de choisir un ensemble d’entrées et d’appliquer celui-ci en tant que filtre au modèle, ce qui vous permet de voir l’influence de ces choix sur le résultat, en fonction des données d’entraînement

Explorer les entrées
  1. Supposons que vous souhaitez cibler un groupe particulier et voir les facteurs qui influencent le plus l’achat dans ce groupe.

    Dans le volet Entrée, cliquez sur Toutes les<> cellules sous Attribut, puis sélectionnez Âge.

    Pour Valeur, sélectionnez la catégorie d’âge la plus jeune.

  2. Notez que même lorsque vous filtrez sur un groupe d’âge particulier, la région Pacifique se trouve en haut de la liste. Cela est dû au fait que les clients de la région Pacifique sont beaucoup plus susceptibles d’acheter un vélo que les clients d’autres régions.

    Étant donné que la région n’est pas quelque chose que vous pouvez influencer, pour supprimer cette variable de la considération et voir d’autres facteurs, vous pouvez modifier à nouveau les entrées.

    Dans le volet Entrée , cliquez sur la cellule vide sous Âge, puis sélectionnez Région.

    Pour Valeur, sélectionnez Europe.

  3. Continuez à ajouter des filtres d’entrée pour vous concentrer sur un groupe d’intérêt particulier.

    Par exemple, pour l’attribut d’entrée, ajoutez Gender et sélectionnez Femelle comme valeur.

    Effet du test sur le résultat des attributs sélectionnés

    Notez comment la liste des variables change. Maintenant , le revenu est la variable la plus importante pour prédire le résultat cible.

    L’ordre dans lequel vous appliquez les filtres d’entrée n’affecte pas les résultats.

Revenir en haut

Sorties

Dans le volet Sorties , vous pouvez choisir le résultat qui vous intéresse. Les réseaux neuronaux vous permettent de spécifier autant de colonnes de résultats que vous le souhaitez, même si l’ajout de sorties supplémentaires ajoute à la complexité du modèle et peut nécessiter beaucoup plus de temps pour traiter.

Pour comparer deux sorties, elles doivent avoir été désignées comme colonnes Predict ou Predict Only .

Explorer les résultats
  1. Utilisez la liste Attributs de sortie pour sélectionner un attribut.

  2. Sélectionnez deux résultats dans les listes Valeur 1 et Valeur 2. Ces deux états de l’attribut de sortie sont comparés dans le volet Variables .

Revenir en haut

En savoir plus sur les modèles de réseau neuronal

Les informations de la visionneuse sont extraites du serveur à l’aide d’une procédure stockée spécifique à ce type de modèle : System.Microsoft.AnalysisServices.System.DataMining.NeuralNet.GetAttributeScores.

Si vous souhaitez créer un modèle avec plusieurs attributs prédictibles à l’aide des compléments, utilisez les options de modélisation avancées .

Pour plus d’informations, consultez Créer une structure d’exploration de données (compléments d’exploration de données SQL Server) et Ajouter un modèle à une structure (compléments d’exploration de données pour Excel).

Voir aussi

Modèles de navigation dans Excel (compléments d’exploration de données SQL Server)