Freigeben über


Erkunden des Entscheidungsstrukturmodells (Grundlegendes Data Mining-Lernprogramm)

Der Microsoft Decision Trees-Algorithmus sagt voraus, welche Spalten die Kaufentscheidung für ein Fahrrad basierend auf den verbleibenden Spalten im Schulungssatz beeinflussen werden.

Registerkarte 'Entscheidungsstruktur'

Auf der Registerkarte " Entscheidungsstruktur " können Sie Entscheidungsstrukturen für jedes vorhersehbare Attribut im Dataset anzeigen.

In diesem Fall prognostiziert das Modell nur die Spalte "Bike Buyer", daher ist nur ein Baum sichtbar. Wenn mehr Bäume vorhanden sind, könnten Sie das Baumfeld verwenden, um einen anderen Baum auszuwählen.

Während Sie das TM_Decision_Tree Modell in der Entscheidungsstrukturanzeige anzeigen, können Sie die wichtigsten Attribute auf der linken Seite des Diagramms sehen. "Wichtigste" bedeutet, dass diese Attribute den größten Einfluss auf das Ergebnis haben. Attribute, die sich weiter unten in der Struktur (rechts vom Diagramm) befinden, haben weniger Auswirkungen.

In diesem Beispiel ist das Alter der wichtigste Faktor bei der Vorhersage des Fahrradkaufs. Das Modell gruppiert Kunden nach Alter und zeigt dann das nächste wichtigere Attribut für jede Altersgruppe an. In der Gruppe der Kunden im Alter von 34 bis 40 Jahren ist die Anzahl der Autos beispielsweise der stärkste Prädiktor nach dem Alter.

Um das Modell auf der Registerkarte "Entscheidungsbaum" zu erkunden

  1. Wählen Sie in Data Mining Designer die Registerkarte "Mining Model Viewer" aus.

    Der Designer wird standardmäßig mit dem ersten Modell geöffnet, das der Struktur hinzugefügt wurde – in diesem Fall TM_Decision_Tree.

  2. Verwenden Sie die Lupenschaltflächen, um die Größe der Baumanzeige anzupassen.

    Standardmäßig zeigt der Microsoft Tree Viewer nur die ersten drei Ebenen der Struktur an. Wenn die Struktur weniger als drei Ebenen enthält, zeigt der Viewer nur die vorhandenen Ebenen an. Sie können weitere Ebenen anzeigen, indem Sie den Schieberegler " Ebene anzeigen " oder die Liste "Standarderweiterung " verwenden.

  3. Show Level zur vierten Leiste schieben.

  4. Ändern Sie den Wert für den Hintergrund in 1.

    Durch Ändern der Einstellung "Hintergrund " können Sie schnell die Anzahl der Fälle in jedem Knoten sehen, die den Zielwert 1 für [Bike Buyer] aufweisen. Denken Sie daran, dass in diesem speziellen Szenario jeder Fall einen Kunden darstellt. Der Wert 1 gibt an, dass der Kunde zuvor ein Fahrrad gekauft hat; der Wert 0 gibt an, dass der Kunde kein Fahrrad gekauft hat. Je dunkler die Schattierung des Knotens ist, desto höher ist der Prozentsatz der Fälle im Knoten mit dem Zielwert.

  5. Platzieren Sie den Cursor über dem Knoten mit der Bezeichnung "Alle". Ein Tooltip zeigt die folgenden Informationen an:

    • Gesamtzahl der Fälle

    • Anzahl der Nicht-Bike-Käufer-Fälle

    • Anzahl der Fahrradkäuferfälle

    • Anzahl der Fälle mit fehlenden Werten für [Bike Buyer]

    Platzieren Sie alternativ den Cursor über einen beliebigen Knoten in der Struktur, um die Bedingung anzuzeigen, die erforderlich ist, um diesen Knoten von dem Knoten zu erreichen, der vor ihm liegt. Sie können diese Informationen auch in der Mininglegende anzeigen.

  6. Klicken Sie auf den Knoten für Alter >=34 und < 41. Das Histogramm wird als dünner horizontaler Balken über den Knoten angezeigt und stellt die Verteilung von Kunden in dieser Altersspanne dar, die zuvor (rosa) und nicht (blau) ein Fahrrad erworben hat. Der Betrachter zeigt uns, dass Kunden zwischen 34 und 40 Jahren mit einem oder ohne Autos wahrscheinlich ein Fahrrad kaufen. Wir stellen fest, dass die Wahrscheinlichkeit, ein Fahrrad zu kaufen, steigt, wenn der Kunde tatsächlich 38 bis 40 Jahre alt ist.

Da Sie beim Erstellen der Struktur und des Modells Drillthrough aktiviert haben, können Sie detaillierte Informationen aus den Modellfällen und der Miningstruktur abrufen, einschließlich der Spalten, die nicht im Miningmodell enthalten waren (z. B. emailAddress, FirstName).

Weitere Informationen finden Sie unter Drillthrough Queries (Data Mining).

Um zu den Falldaten zu gelangen, führen Sie eine detaillierte Analyse durch.

  1. Klicken Sie mit der rechten Maustaste auf einen Knoten, und wählen Sie " Drill Through " und dann "Nur Modellspalten" aus.

    Die Details für jeden Schulungsfall werden im Tabellenkalkulationsformat angezeigt. Diese Details stammen aus der vTargetMail-Ansicht, die Sie beim Erstellen der Miningstruktur als Falltabelle ausgewählt haben.

  2. Klicken Sie mit der rechten Maustaste auf einen Knoten, und wählen Sie " Drill Through " und dann "Modell" und "Strukturspalten" aus.

    Dasselbe Arbeitsblatt wird mit den am Ende angefügten Strukturspalten angezeigt.

Registerkarte "Abhängigkeitsnetzwerk"

Auf der Registerkarte " Abhängigkeitsnetzwerk " werden die Beziehungen zwischen den Attributen angezeigt, die zur prädiktiven Fähigkeit des Miningmodells beitragen. Der Dependency Network Viewer verstärkt unsere Erkenntnisse, dass Alter und Region wichtige Faktoren bei der Vorhersage des Fahrradkaufs sind.

So erkunden Sie das Modell auf der Registerkarte "Abhängigkeitsnetzwerk"
  1. Klicken Sie auf den Bike Buyer Knoten, um seine Abhängigkeiten zu identifizieren.

    Der mittlere Knoten für das Abhängigkeitsnetzwerk, Bike Buyerstellt das vorhersagbare Attribut im Miningmodell dar. Im Diagramm werden alle verbundenen Knoten hervorgehoben, die auswirkungen auf das vorhersagbare Attribut haben.

  2. Passen Sie den Schieberegler "Alle Links " an, um das einflussreichste Attribut zu identifizieren.

    Wenn Sie den Schieberegler nach unten ziehen, werden Attribute, die nur schwache Auswirkungen auf die Spalte [Bike Buyer] haben, aus dem Diagramm entfernt. Durch Anpassen des Schiebereglers können Sie feststellen, dass Alter und Region die größten Faktoren sind, um vorherzusagen, ob jemand ein Fahrradkäufer ist.

Lesen Sie diese Themen, um die Daten mithilfe der anderen Arten von Modellen zu untersuchen.

Nächste Aufgabe in der Lektion

Erkunden des Clusteringmodells (Grundlegendes Data Mining-Lernprogramm)

Siehe auch

Aufgaben des Miningmodell-Viewers und praktische Anleitungen
Registerkarte "Entscheidungsstruktur" (Miningmodell-Viewer)
Registerkarte "Abhängigkeitsnetzwerk" (Miningmodell-Viewer)
Durchsuchen eines Modells mithilfe des Microsoft Tree Viewers