Freigeben über


Inhalt von Miningmodellen für logistische Regressionsmodelle (Analysis Services - Data Mining)

In diesem Thema werden Miningmodellinhalte beschrieben, die spezifisch für Modelle sind, die den Microsoft Logistic Regression-Algorithmus verwenden. Eine Erläuterung dazu, wie Statistiken und Struktur interpretiert werden, die von allen Modelltypen gemeinsam genutzt werden, sowie allgemeine Definitionen von Begriffen im Zusammenhang mit Miningmodellinhalten finden Sie unter Mining Model Content (Analysis Services - Data Mining).

Grundlegendes zur Struktur eines Logistischen Regressionsmodells

Ein logistisches Regressionsmodell wird mithilfe des Microsoft Neural Network-Algorithmus mit Parametern erstellt, die das Modell einschränken, um den ausgeblendeten Knoten zu beseitigen. Daher ist die Gesamtstruktur eines logistischen Regressionsmodells fast identisch mit dem eines neuralen Netzwerks: Jedes Modell verfügt über einen einzelnen übergeordneten Knoten, der das Modell und seine Metadaten darstellt, und einen speziellen Randstatistikknoten (NODE_TYPE = 24), der beschreibende Statistiken zu den im Modell verwendeten Eingaben bereitstellt.

Darüber hinaus enthält das Modell ein Subnetz (NODE_TYPE = 17) für jedes vorhersagbare Attribut. Genau wie in einem neuralen Netzwerkmodell enthält jedes Subnetz immer zwei Verzweigungen: eine für die Eingabeebene und eine andere Verzweigung, die die ausgeblendete Ebene (NODE_TYPE = 19) und die Ausgabeebene (NODE_TYPE = 20) für das Netzwerk enthält. Dasselbe Subnetz kann für mehrere Attribute verwendet werden, wenn sie als "nur zur Vorhersage" angegeben werden. Vorhersehbare Attribute, die auch Eingaben sind, werden möglicherweise nicht in demselben Subnetz angezeigt.

In einem logistischen Regressionsmodell ist der Knoten, der die versteckte Schicht darstellt, leer und hat keine Nachfolgeknoten. Daher enthält das Modell Knoten, die einzelne Ausgaben (NODE_TYPE = 23) und einzelne Eingaben (NODE_TYPE = 21) darstellen, jedoch keine einzelnen ausgeblendeten Knoten.

Struktur des Inhalts für logistische Regressionsmodell

Standardmäßig wird ein Logistisches Regressionsmodell im Microsoft Neural Network Viewer angezeigt. Mit diesem benutzerdefinierten Viewer können Sie nach Eingabeattributen und deren Werten filtern und grafisch sehen, wie sie sich auf die Ausgaben auswirken. Die QuickInfos im Viewer zeigen Ihnen die Wahrscheinlichkeit und den Lift, die mit jedem Eingabe- und Ausgabewertpaar verbunden sind. Weitere Informationen finden Sie unter Durchsuchen eines Modells mithilfe des Microsoft Neural Network Viewers.

Um die Struktur der Eingaben und Subnetze zu untersuchen und detaillierte Statistiken anzuzeigen, können Sie den Microsoft Generic Content Tree Viewer verwenden. Sie können auf einen beliebigen Knoten klicken, um ihn zu erweitern und die untergeordneten Knoten anzuzeigen, oder die Gewichtungen und andere Im Knoten enthaltene Statistiken anzeigen.

Modellinhalt für ein Logistisches Regressionsmodell

Dieser Abschnitt enthält Details und Beispiele nur für die Spalten im Miningmodellinhalt, die eine besondere Relevanz für die logistische Regression haben. Der Modellinhalt ist fast identisch mit dem eines neuralen Netzwerkmodells, aber Beschreibungen, die für neurale Netzwerkmodelle gelten, können in dieser Tabelle zur Vereinfachung wiederholt werden.

Informationen zu allgemeinen Spalten im Schema-Rowset, z. B. MODEL_CATALOG und MODEL_NAME, die hier nicht beschrieben werden, oder erläuterungen der Miningmodellterminologie finden Sie unter Mining Model Content (Analysis Services - Data Mining).

MODELL_KATALOG
Name der Datenbank, in der das Modell gespeichert ist.

MODEL_NAME
Name des Modells.

ATTRIBUTE_NAME
Die Namen des Attributs, das diesem Knoten entspricht.

Knoten Inhalt
Modellwurzel Leer
Marginalstatistik Leer
Eingabeebene Leer
Eingabeknoten Eingabeattribut-Name
Ausgeblendete Ebene Leer
Ausgabeebene Leer
Ausgabeknoten Ausgabe-Attributname

NODE_NAME
Der Name des Knotens. Derzeit enthält diese Spalte den gleichen Wert wie NODE_UNIQUE_NAME, obwohl sich dies in zukünftigen Versionen ändern kann.

NODE_UNIQUE_NAME
Der eindeutige Name des Knotens.

Weitere Informationen dazu, wie die Namen und IDs strukturelle Informationen zum Modell bereitstellen, finden Sie im Abschnitt "Verwenden von Knotennamen und IDs".

NODE_TYPE
Ein logistisches Regressionsmodell gibt die folgenden Knotentypen aus:

Knotentyp-ID BESCHREIBUNG
1 Modell.
17 Organisatorknoten für das Subnetz.
18 Organisatorknoten für die Eingabeebene.
19 Organisatorknoten für die ausgeblendete Ebene. Die verborgene Ebene ist leer.
20 Organisationsknoten für die Ausgabeschicht.
21 Eingabe-Attributknoten.
23 Ausgabe-Attributknoten.
24 Knoten Marginalstatistik.

NODE_CAPTION
Eine Bezeichnung oder eine Beschriftung, die dem Knoten zugeordnet ist. In logistischen Regressionsmodellen immer leer.

Kinderanzahl
Eine Schätzung der Anzahl von Kindknoten, die der Knoten hat.

Knoten Inhalt
Modellwurzel Gibt die Anzahl der untergeordneten Knoten an, die mindestens 1 Netzwerk, 1 erforderlichen Randknoten und 1 erforderliche Eingabeebene umfasst. Wenn der Wert beispielsweise 5 ist, gibt es 3 Subnetze.
Marginalstatistik Immer 0.
Eingabeebene Gibt die Anzahl der Vom Modell verwendeten Eingabeattribute-Werte-Paare an.
Eingabeknoten Immer 0.
Ausgeblendete Schicht In einem logistischen Regressionsmodell immer 0.
Ausgabeebene Gibt die Anzahl der Ausgabewerte an.
Ausgabeknoten Immer 0.

PARENT_UNIQUE_NAME
Der eindeutige Name des übergeordneten Knotens. NULL wird für alle Knoten auf der Stammebene zurückgegeben.

Weitere Informationen dazu, wie die Namen und IDs strukturelle Informationen zum Modell bereitstellen, finden Sie im Abschnitt "Verwenden von Knotennamen und IDs".

Knotenbeschreibung
Eine benutzerfreundliche Beschreibung des Knotens.

Knoten Inhalt
Modellstamm Leer
Marginalstatistik Leer
Eingabeebene Leer
Eingabeknoten Eingabe-Attribut-Name
Ausgeblendete Ebene Leer
Ausgabeebene Leer
Ausgabeknoten Wenn das Ausgabeattribute fortlaufend ist, enthält sie den Namen des Ausgabeattributes.

Wenn das Ausgabeattribute diskret oder diskretisiert ist, enthält sie den Namen des Attributs und den Wert.

NODE_RULE
Eine XML-Beschreibung der Regel, die in den Knoten eingebettet ist.

Knoten Inhalt
Modellstamm Leer
Marginalstatistik Leer
Eingabeebene Leer
Eingabeknoten Ein XML-Fragment, das die gleichen Informationen wie die NODE_DESCRIPTION Spalte enthält.
Ausgeblendete Ebene Leer
Ausgabeebene Leer
Ausgabeknoten Ein XML-Fragment, das die gleichen Informationen wie die NODE_DESCRIPTION Spalte enthält.

MARGINAL_RULE
Für logistische Regressionsmodelle immer leer.

KNOTENWAHRSCHEINLICHKEIT
Die wahrscheinlichkeit, die diesem Knoten zugeordnet ist. Für logistische Regressionsmodelle immer 0.

Marginalwahrscheinlichkeit
Die Wahrscheinlichkeit, einen Knoten vom übergeordneten Knoten aus zu erreichen. Für logistische Regressionsmodelle immer 0.

NODE_DISTRIBUTION
Eine geschachtelte Tabelle, die statistische Informationen für den Knoten enthält. Ausführliche Informationen zum Inhalt dieser Tabelle für jeden Knotentyp finden Sie im Abschnitt "Grundlegendes zur NODE_DISTRIBUTION Tabelle" in "Mining Model Content for Neural Network Models (Analysis Services - Data Mining)".

NODE_SUPPORT
Für logistische Regressionsmodelle immer 0.

Hinweis

Unterstützungswahrscheinlichkeiten sind immer 0, da die Ausgabe dieses Modelltyps nicht probabilistisch ist. Das einzige, was für den Algorithmus sinnvoll ist, ist die Gewichtung; Daher berechnet der Algorithmus keine Wahrscheinlichkeit, Unterstützung oder Varianz.

Informationen zur Unterstützung in den Schulungsfällen für bestimmte Werte finden Sie im Knoten "Marginal Statistics".

MSOLAP_MODEL_COLUMN
|Knoten|Inhalt|
|----------|-------------|
|Modellstamm|Leer|
|Marginalstatistik|Leer|
|Eingabeebene|Leer|
|Eingabeknoten|Name des Eingabeattributes.|
|Ausgeblendete Ebene|Leer|
|Ausgabeebene|Leer|
|Ausgabeknoten|Name des Eingabeattributes.|

MSOLAP_NODE_SCORE
In logistischen Regressionsmodellen immer 0.

MSOLAP_NODE_SHORT_CAPTION
In logistischen Regressionsmodellen immer leer.

Verwenden von Knotennamen und IDs

Die Benennung der Knoten in einem logistischen Regressionsmodell liefert zusätzliche Informationen zu den Beziehungen zwischen Knoten im Modell. In der folgenden Tabelle sind die Konventionen für die IDs aufgeführt, die Knoten auf den einzelnen Ebenen zugewiesen sind.

Knotentyp Konvention für Knoten-ID
Modellwurzel (1) 00000000000000000.
Knoten „Marginalstatistiken“ (24) 10000000000000000
Eingabeebene (18) 30000000000000000
Eingabeknoten (21) Beginnt bei 600000000000000000
Subnetz (17) 20000000000000000
Ausgeblendete Ebene (19) 40000000000000000
Ausgabeebene (20) 50000000000000000
Ausgabeknoten (23) Beginnt bei 80000000000000000

Sie können diese IDs verwenden, um zu bestimmen, wie Ausgabeattribute mit bestimmten Eingabeebenenattributen zusammenhängen, indem Sie die NODE_DISTRIBUTION Tabelle des Ausgabeknotens anzeigen. Jede Zeile in dieser Tabelle enthält eine ID, die auf einen bestimmten Eingabeattributeknoten verweist. Die NODE_DISTRIBUTION Tabelle enthält auch den Koeffizienten für dieses Eingabeausgabepaar.

Siehe auch

Microsoft Logistic Regression Algorithm
Inhalt des Miningmodells für neuronale Netzwerkmodelle (Analysis Services - Data Mining)
Beispiele für Die Abfrage des Logistischen Regressionsmodells
Technische Referenz zum Microsoft Logistics Regressionsalgorithmus