Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Während der Kreuzüberprüfung teilt Analysis Services die Daten in einer Miningstruktur in mehrere Querschnitte auf und testet dann die Struktur und alle zugehörigen Miningmodelle iterativ. Basierend auf dieser Analyse gibt sie eine Reihe von Standardgenauigkeitsmaßen für die Struktur und jedes Modell aus.
Der Bericht enthält einige grundlegende Informationen über die Anzahl der Faltungen in den Daten und die Datenmenge in jeder Faltung sowie eine Reihe allgemeiner Metriken, die die Datenverteilung beschreiben. Indem Sie die allgemeinen Metriken für jeden Querschnitt vergleichen, können Sie die Zuverlässigkeit der Struktur oder des Modells bewerten.
Analysis Services zeigt außerdem eine Reihe detaillierter Maßnahmen für Miningmodelle an. Diese Maßnahmen hängen vom Modelltyp und vom Typ des zu analysierenden Attributs ab: z. B. ob es diskret oder kontinuierlich ist.
Dieser Abschnitt enthält eine Liste der Maßnahmen, die im Bericht "Kreuzüberprüfung " enthalten sind und was sie bedeuten. Ausführliche Informationen dazu, wie jedes Measure berechnet wird, finden Sie unter Kreuzüberprüfungsformeln.
Liste der Maßnahmen im Überprüfungsbericht
In der folgenden Tabelle sind die Maßnahmen aufgeführt, die im Quervalidierungsbericht angezeigt werden. Die Maßnahmen werden nach Testtyp gruppiert, der in der linken Spalte der folgenden Tabelle angegeben ist. In der rechten Spalte wird der Name der Maßnahme aufgeführt, wie er im Bericht angezeigt wird, und es gibt eine kurze Erläuterung, was diese bedeutet.
| Testtyp | Maßnahmen und Beschreibungen |
|---|---|
| Clusterbildung | Measures, die für Clusteringmodelle gelten: Fallwahrscheinlichkeit: Dieses Measure gibt in der Regel an, wie wahrscheinlich ein Fall zu einem bestimmten Cluster gehört. Bei der Kreuzüberprüfung werden die Bewertungen addiert und dann durch die Anzahl der Fälle dividiert, sodass die Bewertung eine durchschnittliche Fallwahrscheinlichkeit ist. |
| Klassifizierung | Maßnahmen, die für Klassifizierungsmodelle gelten: True Positiv/ True Negative/ Falsch Positiv/ Falsch Positiv: Anzahl der Zeilen oder Werte in der Partition, bei denen der vorhergesagte Zustand mit dem Zielzustand übereinstimmt und die Vorhersagewahrscheinlichkeit größer als der angegebene Schwellenwert ist. Fälle mit fehlenden Werten für das Zielattribute werden ausgeschlossen, was bedeutet, dass sich die Anzahl aller Werte möglicherweise nicht addieren kann. |
| Pass/Fail: Anzahl der Zeilen oder Werte in der Partition, in der der vorhergesagte Zustand mit dem Zielzustand übereinstimmt und der Vorhersagewahrscheinlichkeitswert größer als 0 ist. | |
| Wahrscheinlichkeit | Wahrscheinlichkeitskennzahlen gelten für mehrere Modelltypen: Lift: Das Verhältnis der tatsächlichen Vorhersagewahrscheinlichkeit zur Marginalwahrscheinlichkeit in den Testfällen. Zeilen mit fehlenden Werten für das Zielattribute werden ausgeschlossen. Diese Messung zeigt im Allgemeinen, wie viel die Wahrscheinlichkeit des Zielergebnisses verbessert, wenn das Modell verwendet wird. Root Mean Square Error: Mittlere quadratische Abweichung für alle Partitionsfälle, berechnet als Quadratwurzel des durchschnittlichen Fehlers, geteilt durch die Anzahl der Fälle in der Partition, mit Ausnahme von Zeilen, die fehlende Werte für das Zielattribut aufweisen. RMSE ist ein beliebter Schätzer für Predictive Models. Die Bewertung durchschnittliche die Restwerte für jeden Fall, um einen einzelnen Indikator für Modellfehler zu erzielen. Protokollbewertung: Der Logarithmus der tatsächlichen Wahrscheinlichkeit für jeden Fall, summiert und dann durch die Anzahl der Zeilen im Eingabedatensatz dividiert, wobei Zeilen mit fehlenden Werten für das Zielattribute ausgeschlossen sind. Da die Wahrscheinlichkeit als Dezimalbruch dargestellt wird, sind Logarithmuswerte immer negative Zahlen. Eine Zahl, die näher an 0 liegt, ist eine bessere Bewertung. Während unformatierte Bewertungen sehr unregelmäßige oder schiefe Verteilungen aufweisen können, ist eine Protokollbewertung mit einem Prozentsatz vergleichbar. |
| Schätzung | Maßnahmen, die nur für Schätzungsmodelle gelten, die ein kontinuierliches numerisches Attribut vorhersagen: Durchschnittlicher Quadratfehler: Durchschnittlicher Fehler, wenn der vorhergesagte Wert mit dem tatsächlichen Wert verglichen wird. RMSE ist ein beliebter Schätzer für Predictive Models. Die Bewertung durchschnittliche die Restwerte für jeden Fall, um einen einzelnen Indikator für Modellfehler zu erzielen. Mittlerer absoluter Fehler: Durchschnittlicher Fehler, wenn vorhergesagte Werte mit tatsächlichen Werten verglichen werden, berechnet als Mittelwert der absoluten Summe von Fehlern. Der mittlere absolute Fehler ist nützlich, um zu verstehen, wie nah die Vorhersagen insgesamt an die tatsächlichen Werte herankommen. Eine kleinere Bewertung bedeutet, dass Vorhersagen genauer waren. Log Score: Der Logarithmus der tatsächlichen Wahrscheinlichkeit für jeden Fall, summiert und dann geteilt durch die Anzahl der Zeilen im Eingabedatensatz, wobei Zeilen ausgeschlossen werden, die fehlende Werte für das Zielattribut haben. Da die Wahrscheinlichkeit als Dezimalbruch dargestellt wird, sind Logarithmuswerte immer negative Zahlen. Eine Zahl, die näher an 0 liegt, ist eine bessere Bewertung. Während unformatierte Bewertungen sehr unregelmäßige oder schiefe Verteilungen aufweisen können, ist eine Protokollbewertung mit einem Prozentsatz vergleichbar. |
| Aggregate | Aggregierte Messgrößen geben einen Hinweis auf die Varianz in den Ergebnissen für jede Partition. Mittelwert: Mittelwert der Partitionswerte für ein bestimmtes Measure. Standardabweichung: Durchschnitt der Abweichung vom Mittelwert für ein bestimmtes Maß über alle Partitionen in einem Modell. Bei der Kreuzüberprüfung impliziert ein höherer Wert für diese Bewertung eine erhebliche Variation zwischen den Faltungen. |