Freigeben über


Vorhersagerechner (Tabellenanalysetools für Excel)

Vorhersage-Rechner-Tool

Mit dem Tool "Vorhersagerechner " können Sie eine Scorecard erstellen, die verwendet werden kann, um neue Daten zu analysieren und Optionen oder Risiken auszuwerten. Wenn Sie beispielsweise über historische und demografische Daten zu Kunden verfügen, kann Ihnen das Tool "Vorhersagerechner " bei zwei wichtigen Aufgaben helfen:

  • Generieren einer zugrunde liegenden Analyse von demografischen Daten, Einkaufsverhalten und verschiedenen anderen Faktoren.

  • Erstellen einer Arbeits-Scorecard, die Ihnen hilft, Mitglieder auszuwerten und Empfehlungen für neue Produkte oder Serviceangebote zu erstellen.

Der Assistent erstellt außerdem ein Arbeitsblatt, das alle zugrunde liegenden Berechnungen speichert, sodass Sie mit dem Modell interagieren und sehen können, wie sich unterschiedliche Eingabewerte auf die Endbewertung auswirken.

Wenn Sie dies auswählen, kann der Assistent auch eine gedruckte Version des Arbeitsblatts erstellen, die Sie für die Offlinebewertung verwenden können. Es ist nicht möglich, mit dem Modell zu interagieren wie mit der Online Excel-Arbeitsmappe, aber die gedruckte Version stellt alle Berechnungen bereit, die Sie zum Eingeben von Werten und zum Berechnen einer Endbewertung benötigen.

Verwenden des Vorhersagerechnertools

  1. Öffnen Sie eine Excel-Tabelle, die die zu analysierenden Daten enthält.

  2. Klicken Sie auf der Registerkarte "Analysieren" auf "Vorhersagerechner".

  3. Wählen Sie im Dialogfeld „Vorhersagerechner“ für „Ziel“ die Spalte aus, deren Wert Sie vorhersagen möchten, z. B. das Einkaufsverhalten.

  4. Geben Sie den Zielwert an. Wenn der Wert numerisch ist, verwenden Sie die Option "Bereich", und geben Sie dann die Mindest- und Höchstwerte für den gewünschten Bereich ein. Wenn der Wert diskret ist, wählen Sie die Option "Genau " und dann den Wert aus der Dropdownliste aus.

  5. Klicken Sie auf "Spalten auswählen", die für die Analyse verwendet werden sollen.

  6. Wählen Sie im Dialogfeld "Erweiterte Spaltenauswahl " Spalten mit nützlichen Informationen aus. Entfernen Sie alle Spalten, die für die Analyse nicht relevant sind. Klicke auf OK.

    Um eine Verfälschung der Ergebnisse zu vermeiden, sollten Sie auch Spalten entfernen, die doppelte Informationen enthalten. Wenn Sie beispielsweise über eine Spalte "Einkommen" verfügen, die numerische Daten enthält, und eine Spalte "Einkommensgruppe", die die Bezeichnungen "Hoch", "Mittel" und "Niedrig" enthält, sollten Sie nicht beide Spalten im selben Modell einschließen. Stattdessen könnten Sie für jede Spalte ein separates Modell erstellen.

  7. Wählen Sie im Abschnitt "Ausgabeoptionen " die Option "Betriebsrechner " aus, um die Analyse und Scorecard in einer Excel-Arbeitsmappe zu erstellen. Wählen Sie druckerbereiten Rechner aus, um die Analyse zu erstellen und auch einen Bericht zu generieren, der gedruckt und für die Bewertung von Hand verwendet werden kann.

  8. Klicken Sie auf Ausführen.

    Das Tool erstellt neue Arbeitsblätter, die die Berichte und Scorecards enthalten.

Anforderungen

Das Tool "Vorhersagerechner " verwendet den Microsoft Logistic Regression-Algorithmus, der mit diskreten Werten arbeiten kann, sowie diskretisierte und fortlaufende numerische Daten.

Grundlegendes zu den Bewertungsberichten

Wenn Sie beide Ausgabeoptionen auswählen, erstellt der Vorhersagerechner die folgenden drei neuen Arbeitsblätter in der aktuellen Arbeitsmappe:

  • Ein Vorhersagebericht, der die Ergebnisse der Analyse enthält, vollständig mit interaktiven Tabellen und Diagrammen, die Ihnen helfen, mit Interaktionen und Profiten zu experimentieren.

  • Ein interaktiver Vorhersagerechner , mit dem Sie Bewertungen erstellen können.

  • Ein druckbarer Rechner mit Anweisungen und Koeffizienten zur Bewertung.

  • In diesem Abschnitt werden die Informationen in den einzelnen Berichten und die Verwendung der verschiedenen Berichtsoptionen beschrieben.

Vorhersagebericht mit Diagrammen

Der erste Vorhersagebericht trägt den Titel Prognoserechnerbericht für den <Zielstatus> des Zielattributs<>. Es enthält eine Tabelle von Faktoren, die aus der Analyse abgeleitet werden, zusammen mit Tools, mit denen Sie die finanziellen Auswirkungen einer bestimmten Analyse bewerten können.

Tabelle zur Angabe von Kosten und Gewinnen

Das erste Tool in diesem Bericht, auf der oberen linken Seite des Berichts, ist eine Tabelle, in der Sie die Kosten und Gewinne angeben können, die mit der korrekten und fehlerhaften Vorhersage eines Wertes verbunden sind. Diese Kosten und Gewinne werden benötigt, um den optimalen Bewertungsschwellenwert für den Rechner zu berechnen.

Gegenstand Beschreibung und Beispiel
Kosten für falsch-positive Ergebnisse Kosten der Annahme, dass das Modell ein positives Ergebnis richtig vorhergesagt hat, wenn die Vorhersage tatsächlich falsch ist.

Beispielsweise sagt das Modell voraus, dass ein Kunde etwas kauft, und darauf basierend entwickeln Sie eine Kampagne, um diesen Kunden anzusprechen. Sie können hier die Kosten für die Kontaktaufnahme mit dem Kunden eingeben.
Kosten für falsch-negative Ergebnisse Kosten für die Annahme, dass das Modell eine negative Vorhersage korrekt gemacht hat, obwohl die Vorhersage tatsächlich falsch ist.

Beispielsweise könnte das Modell voraussagen, dass ältere Kunden kein Fahrrad kaufen, aber Sie stellen fest, dass das Modell schief wurde, und daher verpassten Sie die Chance, ältere Kunden anzusprechen. Sie können hier möglicherweise Opportunitätskosten für verpasste Gelegenheiten zuweisen.
Wahrer positiver Gewinn Profitieren Sie von der korrekten Vorhersage eines positiven Ergebnisses. Wenn Sie z. B. auf die richtigen Kunden abzielen und Dies zu einem Verkauf führt, würden Sie hier den Gewinn pro Kunde eingeben.
Wahrer negativer Gewinn Profitieren Sie von der korrekten Vorhersage eines negativen Ergebnisses.

Wenn Sie beispielsweise Kunden, die nicht gezielt sein sollen, richtig identifizieren können, können Sie hier X-Anzahl von Werbe-Dollar pro Kunde eingeben.

Diagramm zum Anzeigen des maximalen Gewinns

Wenn Sie Werte in die Tabelle eingeben, werden die zugehörigen Diagramme automatisch aktualisiert, um den besten Punkt für die Maximierung des Gewinns im Hinblick auf das aktuelle Modell anzuzeigen. Das Liniendiagramm rechts neben dieser Tabelle zeigt den Gewinn für verschiedene Bewertungsschwellenwerte an. Der Gewinn wird anhand der Gewinn- und Kostenzahlen, die Sie in die Tabelle eingeben, basierend auf den Vorhersagen und Wahrscheinlichkeiten aus dem Modell geschätzt.

Wenn beispielsweise in der oberen linken Tabelle die Zelle für " Vorgeschlagener Schwellenwert" zum Maximieren des Gewinns den Wert 500 anzeigt, zeigt das Diagramm auf der rechten Seite 500 als höchsten Punkt im Liniendiagramm an. Was dieser Wert von 500 bedeutet, ist, dass Sie zur Maximierung der Gewinne die besten 500 Empfehlungen aus dem Miningmodell verwenden sollten, sortiert nach Wahrscheinlichkeit.

Tabellenauflistung der Punktzahlen für jedes Attribut und jeden Wert

Die Tabelle unten links im Bericht zeigt eine detaillierte Aufschlüsselung der erkannten Werte und die Auswirkungen der einzelnen Werte auf das Ergebnis. Sie können die Werte in dieser Tabelle nicht ändern; sie werden angezeigt, damit Sie die Vorhersage verstehen können.

Die folgende Tabelle zeigt beispielsweise ein Beispiel für die Ergebnisse, wenn das Zielergebnis darin besteht, dass ein Kunde ein Fahrrad kauft. In der Tabelle sind jede Eingabespalte aufgeführt, die im Modell verwendet wurde, unabhängig davon, ob die Eingabe das Modell beeinflusst hat. In der Tabelle werden auch die diskreten Werte und die diskretisierten Werte aufgelistet, wenn die Eingabespalte fortlaufende numerische Daten enthielt.

Die Werte in der Spalte "Relative Auswirkung " sind Wahrscheinlichkeiten, die als Prozentsätze dargestellt werden. Die Zelle wird schattiert, um die Auswirkungen dieses Werts auf die Ergebnisse visuell darzustellen.

Merkmal Wert Relative Auswirkung
Familienstand Verheiratet 0
Familienstand Ledig 71
Geschlecht Weiblich 13
Geschlecht Männlich 0

Sie können diese Faktoren wie folgt interpretieren:

  • Das Heiraten wirkt sich nicht auf die Wahrscheinlichkeit des Kunden aus, ein Fahrrad zu kaufen.

  • Single ist jedoch ein starker Indikator (70 Prozent), dass der Kunde wahrscheinlich ein Fahrrad kauft.

  • Das Geschlecht des Kunden hat nur marginale Auswirkungen (13 Prozent) auf vorhergesagtes Fahrradkaufverhalten, wenn der Kunde eine Frau ist, und hat keine Auswirkungen auf vorhergesagtes Fahrradkaufverhalten, wenn der Kunde ein Mann ist.

Diagramm der kumulativen Fehlklassifizierungskosten

Das Flächendiagramm unten rechts im Bericht zeigt die kumulierten Fehlklassifizierungskosten für verschiedene Bewertungsschwellenwerte. Auch in diesem Diagramm werden die Kosten- und Gewinnzahlen verwendet, die Sie für falsch positive Ergebnisse, echte positive Ergebnisse, falsche negative Ergebnisse und falsch positive Ergebnisse eingeben.

Im Gegensatz zum Diagramm oben rechts im Bericht, das sich auf die Maximierung des Gewinns konzentriert, enthält dieses Diagramm die Kosten für die falsche Vorhersage. Dieses Diagramm ist besonders nützlich in Szenarien wie der Prävention, in denen die Kosten für die Falsche Entscheidung erheblich überwiegen, die Kosten für die korrekte Schätzung.

Obwohl das erste Diagramm vorschlägt, dass das gezielte Ansprechen der top 500 Kunden, die vom Modell vorhergesagt wurden, die Möglichkeit ist, den maximalen Gewinn zu erzielen, könnten Sie sich entscheiden, nachdem Sie sich dieses zweite Diagramm ansehen, dass die Kosten für falsch ausgerichtete Kunden zu groß sind, und Sie könnten stattdessen entscheiden, die Marketingkampagne bei den ersten 400 Kunden zu beenden.

Interaktiver Vorhersagerechner

Das zweite Arbeitsblatt, das vom Tool "Vorhersagerechner" erstellt wurde, lautet "Prognoserechner" für den <Zielzustand> des Zielattributes<>. Es handelt sich um ein interaktives Arbeitsblatt, mit dem Sie einzelne Bewertungen berechnen können. Da dieses Arbeitsblatt Muster und Statistiken verwendet, die im Modell gespeichert sind, können Sie mit verschiedenen Werten experimentieren und sehen, wie sie sich auf die vorhergesagte Bewertung auswirken. Dieser Bericht enthält auch zwei Abschnitte: eine ist interaktiv und eine wird als Referenz bereitgestellt.

Erste Tabelle

Sie können einen neuen Wert in der Spalte "Wert " der Tabelle auswählen oder eingeben, um zu sehen, wie sich das Ändern des Werts auf die Bewertung auswirkt.

Wenn der Bericht beispielsweise die folgenden Werte enthält, können Sie den Wert von Autos auf 1 verringern und dann auf 0 festlegen, wie sich dies auf das Einkaufsverhalten des Kunden auswirkt. Wenn Sie den Wert von Autos auf 0 ändern, ändert sich die Vorhersage am unteren Rand in WAHR.

Merkmal Wert Relative Auswirkung
Familienstand Verheiratet 0
Geschlecht Männlich 0
Einnahmen 39050 - 71062 117
Kinder 0 157
Bildung Junggesellenabschied 22
Besetzung Qualifiziertes Handbuch 33
Besitzer des Privathauses Ja 8
Autos 2 50
Pendlerdistanz 0-1 Meilen 99
Region Nordamerika 0
Alter 37 - 46 5
Gesamt 491
Vorhersage für "Ja" FALSCH

Wenn Sie den neuen Wert eingeben, wechselt die in der Zelle angezeigte Bewertung "Prognose für Ja" zu "Wahr", und die Bewertungen der relativen Auswirkungen für die verschiedenen Attribute werden ebenfalls aktualisiert.

Hinweis

Auch wenn Sie nur einen Wert ändern, z. B. die Anzahl der Autos, können sich die Werte und Auswirkungen anderer Attribute ändern, wenn Sie dies tun. Dies liegt daran, dass Data Mining-Modelle häufig komplexe Beziehungen zwischen Daten finden und eine Variable ändern kann unvorhergesehene Auswirkungen haben. Aus diesem Grund wird empfohlen, den interaktiven Vorhersagerechner zu verwenden, um mit verschiedenen Werten zu experimentieren oder das Miningmodell zu durchsuchen, um die Interaktionen besser zu verstehen. Weitere Informationen finden Sie unter Durchsuchen von Modellen.

Bewertungsaufschlüsselung

Diese Tabelle zeigt die einzelnen Bewertungen für jeden möglichen Status der Eingabespalten und die relativen Auswirkungen, die die Bewertung auf die Ergebnisse hat. Diese Tabelle ist statisch und kann nur referenziert werden.

Druckbarer Vorhersagerechner

Das dritte Arbeitsblatt, das vom Tool "Vorhersagerechner" erstellt wurde, trägt den Titel "Druckbarer Vorhersagerechner für den <Zustand> des Zielattributs<>". Diese Scorecard soll gedruckt werden, damit Sie Punkte manuell berechnen können, wenn Sie sich nicht am Computer befinden.

So drucken und verwenden Sie den vom Vorhersagerechner generierten Bewertungsbericht
  1. Klicken Sie auf die Registerkarte mit dem Titel „Druckbarer Vorhersagerechner“ für <Attribut>.

  2. Wählen Sie im Menü "Excel-Datei" die Option "Seitenansicht" aus.

  3. Ändern Sie die Seitenausrichtung, seitenränder und andere Druckoptionen, bis die Scorecard auf die gewünschte Weise auf die Seite passt.

    Diese Scorecard ist nicht dynamisch und ist in keiner Weise mit dem Modell verbunden, sodass Sie Spalten oder Zeilen verschieben können, um die Formatierung zu verbessern, ohne dass sich die zugrunde liegenden Daten auswirken.

  4. Drucken Sie die Punktekarte.

  5. Wählen Sie für jedes Attribut nur einen Wert aus. Geben Sie für den von Ihnen ausgewählten Wert ein Häkchen in das Feld ein, und schreiben Sie die entsprechende Zahl in der Spalte "Score ".

  6. Füllen Sie so viele Attribute wie möglich aus, um die Genauigkeit sicherzustellen.

  7. Berechnen Sie die Summe der Bewertungen für jedes Attribut, und geben Sie diese Zahl in die Ergebniszeile ein.

  8. Konvertieren Sie die Punktzahl in ein vorhergesagtes Ergebnis, indem Sie die Kriterien verwenden, die unmittelbar nach der Gesamt-Zeile auf dem Blatt gedruckt werden.

Analysis Services stellt den Microsoft Logistic Regression-Algorithmus für die Verwendung in dieser Art von Analyse bereit. Wenn Sie bereits mit der logistischen Regression vertraut sind, können Sie auf einfache Weise logistische Regressionsmodelle erstellen, indem Sie die Erweiterte Option des Data Mining-Clients für Excel verwenden. Weitere Informationen finden Sie unter Advanced Modeling (Data Mining-Add-Ins für Excel).For more information, see Advanced Modeling (Data Mining Add-ins for Excel). Weitere Informationen zu den Optionen und Parametern für logistische Regressionsmodelle finden Sie im Thema "Microsoft Logistic Regression Algorithm" in SQL Server Books Online.

Siehe auch

Tabellenanalysetools für Excel