Partager via


Calculatrice de prédiction (Outils d’analyse de tableau pour Excel)

de calcul de prédictionOutil

L’outil Calculatrice de prédiction vous aide à créer une carte de performance qui peut être utilisée pour analyser de nouvelles données et évaluer les options ou les risques. Par exemple, si vous avez des données historiques et démographiques sur les clients, l’outil Calculatrice de prédiction peut vous aider à effectuer deux tâches clés :

  • Génération d’une analyse sous-jacente des données démographiques, du comportement d’achat et de divers autres facteurs.

  • Création d’une carte de performance opérationnelle qui vous aide à évaluer les membres et à formuler des recommandations pour les nouveaux produits ou offres de services.

L’Assistant crée également une feuille de calcul qui stocke tous les calculs sous-jacents afin que vous puissiez interagir avec le modèle et voir comment différentes valeurs d’entrée affectent le score final.

Si vous le souhaitez, l'assistant peut également créer une version imprimée de la feuille de calcul que vous pouvez utiliser pour l'évaluation hors ligne. Vous ne pouvez pas interagir avec le modèle comme vous le pouvez avec le classeur Excel en ligne, mais la version imprimée fournit tous les calculs dont vous avez besoin pour entrer des valeurs et calculer un score final.

Utilisation de l’outil calculatrice de prédiction

  1. Ouvrez un tableau Excel qui contient les données que vous souhaitez analyser.

  2. Cliquez sur Calculatrice de prédiction sous l’onglet Analyser .

  3. Dans la boîte de dialogue Calculatrice de prédiction , pour Cible, choisissez la colonne que vous souhaitez prédire, telle que le comportement d’achat.

  4. Spécifiez la valeur ciblée. Si la valeur est numérique, utilisez l’option Dans la plage, puis tapez les valeurs minimales et maximales de la plage souhaitée. Si la valeur est discrète, sélectionnez l’option Exactement , puis sélectionnez la valeur dans la liste déroulante.

  5. Cliquez sur Choisir des colonnes à utiliser pour l’analyse.

  6. Dans la boîte de dialogue Sélection avancée des colonnes, sélectionnez les colonnes qui ont des informations utiles. Supprimez les colonnes qui ne sont pas pertinentes pour l’analyse. Cliquez sur OK.

    Pour éviter de fausser les résultats, vous devez également supprimer les colonnes contenant des informations en double. Par exemple, si vous avez une colonne Income qui contient des données numériques et une colonne Groupe de revenus qui contient les étiquettes High, Medium et Low, vous ne devez pas inclure les deux colonnes dans le même modèle. Au lieu de cela, vous pouvez créer un modèle distinct pour chaque colonne.

  7. Dans la section Options de sortie , sélectionnez Calculatrice opérationnelle pour créer l’analyse et la carte de performance dans un classeur Excel. Sélectionnez Calculatrice prête pour l’imprimante pour créer l’analyse et également générer un rapport qui peut être imprimé et utilisé pour l’évaluation à la main.

  8. Cliquez sur Exécuter.

    L’outil crée de nouvelles feuilles de calcul qui contiennent les rapports et les cartes de performance.

Spécifications

L’outil Calculatrice de prédiction utilise l’algorithme Microsoft Logistic Regression, qui peut fonctionner avec des valeurs discrètes, ainsi que des données numériques discrétisées et continues.

Comprendre les rapports de scoring

Si vous sélectionnez les deux options de sortie, la calculatrice de prédiction crée les trois nouvelles feuilles de calcul suivantes dans le classeur actuel :

  • Rapport de prédictionqui contient les résultats de l’analyse, avec des tableaux et graphiques interactifs qui vous aident à expérimenter des interactions et des profits.

  • Calculatrice de prédiction interactive qui vous aide à créer des scores.

  • Calculatrice imprimable avec des instructions et des coefficients à utiliser dans le scoring.

  • Cette section décrit les informations de chaque rapport et explique comment utiliser les différentes options de rapport.

Rapport de prédiction avec graphiques

Le premier rapport de prédiction est intitulé Rapport de prédiction pour l’état cible <de l’attribut <cible>. Il contient une table des facteurs dérivés de l’analyse, ainsi que des outils pour vous aider à évaluer l’impact financier d’une analyse particulière.

Tableau pour spécifier les coûts et les bénéfices

Le premier outil de ce rapport, dans le coin supérieur gauche du rapport, est un tableau dans lequel vous pouvez spécifier les coûts et les bénéfices associés à la prédiction correcte et incorrecte d’une valeur. Ces coûts et bénéfices sont nécessaires pour calculer le seuil de score optimal pour la calculatrice.

Élément Description et exemple
Coût faux positif Coût de l’hypothèse que le modèle a prédit un résultat positif correctement lorsque la prédiction est réellement incorrecte.

Par exemple, le modèle prédit qu’un client achète quelque chose et en fonction de celui-ci, vous concevez une campagne pour cibler ce client. Vous pouvez entrer le coût de la sensibilisation au client ici.
Faux coût négatif Coût de l’hypothèse que le modèle a prédit un négatif correctement lorsque la prédiction est réellement incorrecte.

Par exemple, le modèle peut prédire que les clients plus âgés sont peu susceptibles d’acheter un vélo, mais vous constatez que le modèle était biaisé et qu’en conséquence, vous avez manqué une chance de cibler des clients plus âgés. Vous pouvez attribuer un coût d’opportunité manqué ici.
Vrai bénéfice positif Profitez de la prédiction correcte d’un résultat positif. Par exemple, si vous ciblez les bons clients et que vous ciblez les résultats d’une vente, vous entrez ici le bénéfice par client.
Vrai bénéfice négatif Profitez de la prédiction correcte d’un résultat négatif.

Par exemple, si vous pouvez identifier correctement les clients qui ne doivent pas être ciblés, vous pouvez entrer X nombre de dollars publicitaires par client ici.

Graphique pour afficher le bénéfice maximal

Lorsque vous entrez des valeurs dans le tableau, les graphiques associés sont mis à jour automatiquement pour vous montrer le meilleur point pour optimiser les bénéfices en fonction du modèle actuel. Le graphique en courbes à droite de ce tableau affiche le bénéfice pour différents seuils de score. Le bénéfice est estimé à l’aide des chiffres de profit et de coût que vous tapez dans la table, en fonction des prédictions et des probabilités du modèle.

Par exemple, si, dans le tableau supérieur gauche, la cellule du seuil suggéré pour maximiser le bénéfice affiche la valeur 500, le graphique situé à droite affiche 500 comme point le plus élevé du graphique en courbes. La valeur de 500 signifie que pour maximiser les bénéfices, vous devez utiliser les 500 principales recommandations du modèle d’exploration de données, classées par probabilité.

Tableau répertoriant les scores pour chaque attribut et valeur

Le tableau situé en bas à gauche du rapport montre une répartition détaillée des valeurs détectées et la façon dont chaque valeur affecte le résultat. Vous ne pouvez pas modifier les valeurs de cette table ; elles sont affichées pour vous aider à comprendre la prédiction.

Par exemple, le tableau suivant montre un exemple des résultats lorsque le résultat cible est qu’un client achète un vélo. La table répertorie chaque colonne d’entrée utilisée dans le modèle, que l’entrée ait affecté le modèle. Le tableau répertorie également les valeurs discrètes et les valeurs discrétisées si la colonne d’entrée contenait des données numériques continues.

Les valeurs de la colonne Impact relatif sont des probabilités, représentées sous forme de pourcentages. La cellule est ombrée pour représenter visuellement l’impact de cette valeur sur les résultats.

Caractéristique Valeur Impact relatif
Situation de famille Marié 0
Situation de famille Célibataire 71
Sexe Femelle 13
Sexe Mâle 0

Vous pouvez interpréter ces facteurs comme suit :

  • Être marié n’affecte pas la probabilité du client d’acheter un vélo.

  • Toutefois, être unique est un indicateur fort (70 pour cent) que le client est susceptible d’acheter un vélo.

  • Le sexe du client n’a qu’un effet marginal (13 pour cent) sur le comportement d’achat de vélo prédit si le client est une femme, et n’a aucun effet sur le comportement d’achat de vélo prédit si le client est un homme.

Graphique du coût de classification incorrecte cumulative

Le graphique en aires en bas à droite du rapport affiche le coût cumulé de classification incorrecte pour différents seuils de score. Ce graphique utilise également les chiffres de coût et de profit que vous entrez pour les faux positifs, les vrais positifs, les faux négatifs et les faux positifs.

Contrairement au graphique en haut à droite du rapport, qui se concentre sur l’optimisation des bénéfices, ce graphique intègre le coût de la prédiction incorrecte. Ce graphique est particulièrement utile dans les scénarios tels que la prévention, où le coût de la prise de la mauvaise décision l’emporte considérablement sur le coût de deviner correctement.

Par exemple, bien que le premier graphique suggère que le ciblage des 500 premiers clients prédits par le modèle est le moyen d’atteindre le maximum de bénéfices, vous pouvez décider après avoir examiné ce deuxième graphique que les coûts de ciblage incorrect des clients est trop grand, et décidez plutôt de couper la campagne marketing aux 400 premiers clients.

Calculatrice de prédiction interactive

La deuxième feuille de calcul créée par l’outil Calculatrice de prédiction est intitulée Calculatrice de prédiction pour l’état> cible de l’attribut <<>cible. Il s’agit d’une feuille de calcul interactive que vous pouvez utiliser pour calculer des scores individuels. Étant donné que cette feuille de calcul utilise des modèles et des statistiques stockés dans le modèle, vous pouvez expérimenter des valeurs différentes et voir comment elles affectent le score prédit. Ce rapport comporte également deux sections : l’une est interactive et l’autre est fournie en tant que référence.

Première table

Vous pouvez sélectionner ou taper une nouvelle valeur dans la colonne Valeur de la table pour voir comment la modification de la valeur affecte le score.

Par exemple, si le rapport contient les valeurs suivantes, vous pouvez réduire la valeur de Cars à 1, puis à 0 pour voir comment cela affecte le comportement d’achat des clients. Lorsque vous modifiez la valeur de Cars sur 0, la prédiction en bas passe à TRUE.

Caractéristique Valeur Impact relatif
Situation de famille Marié 0
Sexe Mâle 0
Revenus 39050 - 71062 117
Enfants 0 157
Éducation Célibataires 22
Profession Travailleur manuel qualifié 33
Propriétaire de la maison Oui 8
Voitures 2 50
Distance de trajet 0-1 Kilomètres 99
Région Amérique du Nord 0
Âge 37 - 46 5
Somme 491
Prédiction pour « Oui » FAUX

Lorsque vous tapez la nouvelle valeur, le score affiché dans la cellule, Prédiction pour Oui, passe à TRUE et les scores d’impact relatif pour les différents attributs sont également mis à jour.

Remarque

Même si vous modifiez une seule valeur, comme le nombre de voitures, les valeurs et les impacts d’autres attributs peuvent changer lorsque vous le faites. Cela est dû au fait que les modèles d’exploration de données trouvent souvent des relations complexes entre les données et que la modification d’une variable peut avoir des effets imprévus. Pour cette raison, nous vous recommandons d’utiliser la calculatrice de prédiction interactive pour expérimenter différentes valeurs ou de parcourir le modèle d’exploration de données pour mieux comprendre les interactions. Pour plus d’informations, consultez Parcourir les modèles.

Répartition des scores

Ce tableau présente les scores individuels pour chaque état possible des colonnes d’entrée et l’impact relatif que le score a sur les résultats. Cette table est statique et pour référence uniquement.

Calculatrice de prédiction imprimable

La troisième feuille de calcul créée par l’outil Calculatrice de prédiction est intitulée Calculatrice de prédiction imprimable pour l’état < cible> de < l’attribut> cible. Cette carte de performance est destinée à être imprimée afin que vous puissiez calculer manuellement les scores lorsque vous êtes absent de votre ordinateur.

Pour imprimer et utiliser le rapport de scoring généré par la calculatrice de prédiction
  1. Cliquez sur l’onglet intitulé Calculatrice de prédiction imprimable pour <l’attribut>.

  2. Dans le menu Fichier Excel, sélectionnez Aperçu avant impression.

  3. Modifiez l’orientation de la page, les marges et d’autres options d’impression jusqu’à ce que la carte de performance corresponde à la page comme vous le souhaitez.

    Cette carte de performance n’est pas dynamique et n’est pas connectée au modèle de manière à ce que vous puissiez déplacer des colonnes ou des lignes pour améliorer la mise en forme sans affecter les données sous-jacentes.

  4. Imprimez la feuille de score.

  5. Pour chaque attribut, choisissez une seule valeur. Pour la valeur que vous choisissez, placez une coche dans la zone et écrivez le nombre correspondant dans la colonne Score .

  6. Renseignez autant d’attributs que possible pour garantir la précision.

  7. Calculez la somme des scores pour chaque attribut et entrez ce nombre dans la ligne Total .

  8. Convertissez le score en résultat prédit en utilisant les critères imprimés sur la feuille immédiatement après la ligne Total .

Analysis Services fournit l’algorithme Microsoft Logistic Regression à utiliser dans ce type d’analyse. Si vous connaissez déjà la régression logistique, vous pouvez facilement créer des modèles de régression logistique à l’aide de l’option Avancé du client d’exploration de données pour Excel. Pour plus d’informations, consultez Advanced Modeling (Compléments d’exploration de données pour Excel). Pour plus d’informations sur les options et les paramètres des modèles de régression logistique, consultez la rubrique « Algorithme de régression logistique Microsoft » dans la documentation en ligne de SQL Server.

Voir aussi

Outils d’analyse de tableau pour Excel