Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gilt für:
SQL Server 2019 und frühere Analysis Services
Azure Analysis Services
Fabric/Power BI Premium
Von Bedeutung
Data Mining wurde in SQL Server 2017 Analysis Services verworfen und ist in SQL Server 2022 Analysis Services eingestellt worden. Die Dokumentation wird nicht für veraltete und nicht mehr unterstützte Features aktualisiert. Weitere Informationen finden Sie unter "Analysis Services-Abwärtskompatibilität".
Eine Klassifizierungsmatrix sortiert alle Fälle aus dem Modell in Kategorien, indem ermittelt wird, ob der vorhergesagte Wert mit dem tatsächlichen Wert übereinstimmt. Alle Fälle in jeder Kategorie werden dann gezählt, und die Summen werden in der Matrix angezeigt. Die Klassifizierungsmatrix ist ein Standardtool für die Auswertung statistischer Modelle und wird manchmal als Verwirrungsmatrix bezeichnet.
Das Diagramm, das erstellt wird, wenn Sie die Option "Klassifizierungsmatrix " auswählen, vergleicht die tatsächlichen mit vorhergesagten Werten für jeden von Ihnen angegebenen vorhergesagten Zustand. Die Zeilen in der Matrix stellen die vorhergesagten Werte für das Modell dar, während die Spalten die tatsächlichen Werte darstellen. Die in der Analyse verwendeten Kategorien sind falsch positiv, wahr positiv, falsch negativ und wahr negativ
Eine Klassifikationsmatrix ist ein wichtiges Tool zur Bewertung der Ergebnisse der Vorhersage, da es das Verständnis erleichtert und die Auswirkungen falscher Vorhersagen nachvollziehbar macht. Wenn Sie die Menge und Prozentsätze in jeder Zelle dieser Matrix anzeigen, können Sie schnell sehen, wie oft das Modell genau vorhergesagt wurde.
In diesem Abschnitt wird erläutert, wie Sie eine Klassifizierungsmatrix erstellen und die Ergebnisse interpretieren.
Grundlegendes zur Klassifizierungsmatrix
Berücksichtigen Sie das Modell, das Sie als Teil des Lernprogramms zum Einfachen Data Mining erstellt haben. Das [TM_DecisionTree]-Modell wird verwendet, um eine gezielte Mailingkampagne zu erstellen, und kann verwendet werden, um vorherzusagen, welche Kunden höchstwahrscheinlich ein Fahrrad kaufen. Um diese erwartete Nützlichkeit dieses Modells zu testen, verwenden Sie einen Datensatz, für den die Werte des Ergebnisattributes [Bike Buyer] bereits bekannt sind. In der Regel verwenden Sie den Testdatensatz, den Sie bei der Erstellung der Miningstruktur erstellt haben, die für die Schulung des Modells verwendet wird.
Es gibt nur zwei mögliche Ergebnisse: Ja (der Kunde wird wahrscheinlich ein Fahrrad kaufen), und nein (der Kunde wird wahrscheinlich kein Fahrrad kaufen). Daher ist die resultierende Klassifizierungsmatrix relativ einfach.
Interpretieren der Ergebnisse
Die folgende Tabelle zeigt die Klassifizierungsmatrix für das TM_DecisionTree-Modell. Denken Sie daran, dass für dieses vorhersehbare Attribut "0" "Nein" und "1" "Ja" bedeutet.
| Vorhergesagt | 0 (ist) | 1 (tatsächlich) |
|---|---|---|
| 0 | 362 | 144 |
| 1 | 121 | 373 |
Die erste Ergebniszelle, die den Wert 362 enthält, gibt die Anzahl der wahr positiven Ergebnisse für den Wert 0 an. Da 0 angibt, dass der Kunde kein Fahrrad gekauft hat, teilt ihnen diese Statistik mit, dass das Modell den richtigen Wert für Nicht-Fahrradkäufer in 362 Fällen vorhergesagt hat.
Die Zelle direkt darunter, die den Wert 121 enthält, informiert Sie über die Anzahl falsch positiver Ergebnisse oder wie oft das Modell vorhergesagt hat, dass jemand ein Fahrrad kaufen würde, wenn er tatsächlich nicht.
Die Zelle, die den Wert 144 enthält, gibt die Anzahl falsch positiver Ergebnisse für den Wert 1 an. Da 1 bedeutet, dass der Kunde ein Fahrrad gekauft hat, teilt ihnen diese Statistik mit, dass das Modell in 144 Fällen vorhergesagt hat, dass jemand kein Fahrrad kaufen würde, wenn er es tatsächlich getan hat.
Schließlich gibt die Zelle, die den Wert 373 enthält, die Anzahl der wahr positiven Werte für den Zielwert 1 an. Mit anderen Worten, in 373 Fällen hat das Modell richtig vorhergesagt, dass jemand ein Fahrrad kaufen würde.
Indem Sie die Werte in Zellen addieren, die diagonal nebeneinander liegen, können Sie die Gesamtgenauigkeit des Modells bestimmen. Eine Diagonale teilt Ihnen die Gesamtzahl der genauen Vorhersagen mit, und die andere Diagonale teilt Ihnen die Gesamtanzahl der fehlerhaften Vorhersagen mit.
Verwenden mehrerer vorhersagbarer Werte
Der [Bike Buyer]-Fall ist besonders leicht zu interpretieren, da es nur zwei mögliche Werte gibt. Wenn das vorhersagbare Attribut mehrere mögliche Werte aufweist, fügt die Klassifizierungsmatrix eine neue Spalte für jeden möglichen tatsächlichen Wert hinzu und zählt dann die Anzahl der Übereinstimmungen für jeden vorhergesagten Wert. In der folgenden Tabelle sind die Ergebnisse eines anderen Modells dargestellt, wobei drei Werte (0, 1, 2) möglich sind.
| Vorhergesagt | 0 (ist) | 1 (ist) | 2 (Istwert) |
|---|---|---|---|
| 0 | 111 | 3 | 5 |
| 1 | 2 | 123 | 17 |
| 2 | 19 | 0 | 20 |
Obwohl das Hinzufügen weiterer Spalten den Bericht komplexer aussehen lässt, kann das zusätzliche Detail sehr nützlich sein, wenn Sie die kumulierten Kosten für die falsche Vorhersage bewerten möchten. Zum Erstellen von Summen auf den Diagonalen oder zum Vergleichen der Ergebnisse für verschiedene Zeilenkombinationen können Sie auf die Schaltfläche "Kopieren " klicken, die auf der Registerkarte "Klassifizierungsmatrix " angegeben ist, und den Bericht in Excel einfügen. Alternativ können Sie einen Client wie den Data Mining-Client für Excel verwenden, der SQL Server 2005 (9.x) und höhere Versionen unterstützt, um einen Klassifizierungsbericht direkt in Excel zu erstellen, der sowohl Anzahlen als auch Prozentsätze enthält. Weitere Informationen finden Sie unter SQL Server Data Mining.
Einschränkungen für die Klassifizierungsmatrix
Eine Klassifizierungsmatrix kann nur mit diskreten vorhersagbaren Attributen verwendet werden.
Obwohl Sie beim Auswählen von Modellen auf der Registerkarte " Eingabeauswahl " des Designers für Mininggenauigkeitsdiagramme mehrere Modelle hinzufügen können, wird auf der Registerkarte "Klassifizierungsmatrix " für jedes Modell eine separate Matrix angezeigt.
Verwandte Inhalte
Die folgenden Themen enthalten weitere Informationen dazu, wie Sie Klassifizierungsmatrizen und andere Diagramme erstellen und verwenden können.
| Themen | Links |
|---|---|
| Erläutert verwandte Diagrammtypen. |
Lift-Diagramm (Analysis Services - Data Mining) Gewinndiagramm (Analysis Services - Data Mining) Punktdiagramm (Analysis Services - Data Mining) |
| Beschreibt die Verwendung von Kreuzvalidierung für Miningmodelle und Datenstrukturen. | Cross-Validation (Analysis Services - Data Mining) |
| Beschreibt die Schritte zum Erstellen von Liftdiagrammen und anderen Genauigkeitsdiagrammen. | Test- und Validierungsaufgaben und Vorgehensweisen (Data Mining) |