Freigeben über


Inhalt des Miningmodells für Assoziationsmodelle (Analysis Services - Data Mining)

In diesem Thema werden Miningmodellinhalte beschrieben, die spezifisch für Modelle sind, die den Microsoft Association Rules-Algorithmus verwenden. Eine Erläuterung allgemeiner und statistischer Terminologie im Zusammenhang mit Miningmodellinhalten, die für alle Modelltypen gelten, finden Sie unter Mining Model Content (Analysis Services - Data Mining).

Grundlegendes zur Struktur eines Zuordnungsmodells

Ein Zuordnungsmodell verfügt über eine einfache Struktur. Jedes Modell verfügt über einen einzelnen übergeordneten Knoten, der das Modell und seine Metadaten darstellt, und jeder übergeordnete Knoten verfügt über eine flache Liste mit Itemsets und Regeln. Die Itemsets und Regeln sind nicht in Bäumen organisiert. Sie sind so sortiert, dass die Itemsets zuerst kommen und die Regeln danach, wie im folgenden Diagramm dargestellt.

Struktur des Modellinhalts für zuordnungsmodelle

Jedes Itemset ist in einem eigenen Knoten enthalten (NODE_TYPE = 7). Der Knoten enthält die Definition des Itemsets, die Anzahl der Fälle, die dieses Itemset enthalten, und andere Informationen.

Jede Regel ist auch in einem eigenen Knoten enthalten (NODE_TYPE = 8). Eine Regel beschreibt ein allgemeines Muster für die Zuordnung von Elementen. Eine Regel ist wie eine IF-THEN-Anweisung. Auf der linken Seite der Regel wird eine vorhandene Bedingung oder eine Reihe von Bedingungen angezeigt. Auf der rechten Seite der Regel wird das Element in Ihrem Dataset angezeigt, das in der Regel den Bedingungen auf der linken Seite zugeordnet ist.

Anmerkung Wenn Sie entweder die Regeln oder die Itemsets extrahieren möchten, können Sie eine Abfrage verwenden, um nur die gewünschten Knotentypen zurückzugeben. Weitere Informationen finden Sie unter Zuordnungsmodellabfragebeispiele.

Modellinhalt für ein Assoziationsmodell

Dieser Abschnitt enthält Details und Beispiele nur für diese Spalten im Miningmodellinhalt, die für Zuordnungsmodelle relevant sind.

Informationen zu den allgemeinen Spalten im Schema-Rowset, z. B. MODEL_CATALOG und MODEL_NAME, finden Sie unter Mining Model Content (Analysis Services - Data Mining).For information about the general-purpose columns in the schema rowset, such as MODEL_CATALOG and MODEL_NAME, see Mining Model Content (Analysis Services - Data Mining).

MODELL_KATALOG
Name der Datenbank, in der das Modell gespeichert ist.

MODEL_NAME
Name des Modells.

ATTRIBUTE_NAME
Die Namen der Attribute, die diesem Knoten entsprechen.

NODE_NAME
Der Name des Knotens. Bei einem Zuordnungsmodell enthält diese Spalte denselben Wert wie NODE_UNIQUE_NAME.

NODE_UNIQUE_NAME
Der eindeutige Name des Knotens.

NODE_TYPE
Ein Zuordnungsmodell gibt nur die folgenden Knotentypen aus:

Knotentyp-ID Typ
1 (Modell) Stamm- oder übergeordneter Knoten.
7 (Elementensatz) Ein Itemset oder eine Auflistung von Attributwertpaaren. Beispiele

Product 1 = Existing, Product 2 = Existing

oder

Gender = Male.
8 (Regel) Eine Regel, die definiert, wie Elemente miteinander zusammenhängen.

Beispiel:

Product 1 = Existing, Product 2 = Existing -> Product 3 = Existing.

NODE_BESCHRIFTUNG
Eine Bezeichnung oder eine Beschriftung, die dem Knoten zugeordnet ist.

Itemset-Knoten Eine durch Trennzeichen getrennte Liste von Elementen.

Regelknoten Enthält die linken und rechten Seiten der Regel.

Kinderanzahl
Gibt die Anzahl der Kinder des aktuellen Knotens an.

Übergeordneter Knoten Gibt die Gesamtanzahl der Itemsets plus Regeln an.

Hinweis

Eine Aufschlüsselung der Anzahl für Itemsets und Regeln finden Sie im NODE_DESCRIPTION für den Stammknoten des Modells.

Itemset- oder Regelknoten Immer 0.

PARENT_UNIQUE_NAME
Der eindeutige Name des übergeordneten Knotens.

Übergeordneter Knoten Ist immer NULL.

Itemset- oder Regelknoten Immer 0.

Knotenbeschreibung
Eine benutzerfreundliche Beschreibung des Inhalts des Knotens.

Übergeordneter Knoten Enthält eine durch Trennzeichen getrennte Liste der folgenden Informationen zum Modell:

Gegenstand BESCHREIBUNG
ANZAHL_DER_ELEMENTE Anzahl aller Itemsets im Modell.
RULE_COUNT Anzahl aller Regeln im Modell.
MIN_SUPPORT Die minimale Unterstützung, die für ein einzelnes Itemset gefunden wurde.

Anmerkung Dieser Wert unterscheidet sich möglicherweise von dem Wert, den Sie für den PARAMETER MINIMUM _SUPPORT festgelegt haben.
Maximale Unterstützung Der maximale Support für ein einzelnes Itemset.

Anmerkung Dieser Wert unterscheidet sich möglicherweise von dem Wert, den Sie für den parameter MAXIMUM_SUPPORT festgelegt haben.
MIN_ITEMSET_SIZE Die Größe des kleinsten Itemsets, dargestellt als Anzahl von Elementen.

Ein Wert von 0 gibt an, dass der Missing Zustand als unabhängiges Element behandelt wurde.

Anmerkung Der Standardwert des MINIMUM_ITEMSET_SIZE-Parameters ist 1.
MAX-Satzgröße Gibt die Größe des größten gefundenen Itemsets an.

Anmerkung Dieser Wert wird durch den Wert eingeschränkt, den Sie beim Erstellen des Modells für den parameter MAX_ITEMSET_SIZE festgelegt haben. Dieser Wert kann diesen Wert niemals überschreiten; Es kann jedoch weniger sein. Der Standardwert ist 3.
MIN_PROBABILITY Die Mindestwahrscheinlichkeit, die für ein einzelnes Itemset oder eine Regel im Modell erkannt wurde.

Beispiel: 0.400390625

Anmerkung Bei Itemsets ist dieser Wert immer größer als der Wert, den Sie beim Erstellen des Modells für den parameter MINIMUM_PROBABILITY festgelegt haben.
MAXIMALE_WAHRSCHEINLICHKEIT Die maximale Wahrscheinlichkeit, die für ein einzelnes Itemset oder eine Regel im Modell erkannt wurde.

Beispiel: 1

Anmerkung Es gibt keinen Parameter, um die maximale Wahrscheinlichkeit von Itemsets einzuschränken. Wenn Sie elemente entfernen möchten, die zu häufig sind, verwenden Sie stattdessen den MAXIMUM_SUPPORT-Parameter .
MIN_LIFT Die mindeste Hebung, die vom Modell für alle Itemsets bereitgestellt wird.

Beispiel: 0.14309369632511

Hinweis: Die Kenntnis des minimalen Lifts kann Ihnen helfen zu bestimmen, ob der Lift für ein Itemset von Bedeutung ist.
MAX_LIFT Die maximale Anzahl von Liften, die vom Modell für jedes Itemset bereitgestellt wird.

Beispiel: 1.95758227647523 Hinweis: Die Kenntnis des maximalen Liftes kann Ihnen helfen zu bestimmen, ob der Lift für ein elementet signifikant ist.

Itemset-Knoten Itemset-Knoten enthalten eine Liste der Elemente, die als durch Trennzeichen getrennte Textzeichenfolge angezeigt werden.

Beispiel:

Touring Tire = Existing, Water Bottle = Existing

Das bedeutet, dass Tourenreifen und Wasserflaschen zusammen gekauft wurden.

Regelknoten Regelknoten enthalten eine linke und rechte Seite der Regel, getrennt durch einen Pfeil.

Beispiel: Touring Tire = Existing, Water Bottle = Existing -> Cycling cap = Existing

Das bedeutet, dass jemand, der einen Tourenreifen und eine Wasserflasche gekauft hat, wahrscheinlich auch eine Radmütze kaufen wird.

NODE_RULE
Ein XML-Fragment, das die Regel oder das Itemset beschreibt, die in den Knoten eingebettet sind.

Übergeordneter Knoten Leer.

Itemset-Knoten Leer.

Regelknoten Das XML-Fragment enthält zusätzliche nützliche Informationen zur Regel, z. B. Unterstützung, Konfidenz und Anzahl von Elementen sowie die ID des Knotens, der die linke Seite der Regel darstellt.

MARGINAL_REGEL
Leer.

KNOTENWAHRSCHEINLICHKEIT
Eine Wahrscheinlichkeits- oder Konfidenzbewertung, die dem Itemset oder der Regel zugeordnet ist.

Übergeordneter Knoten Immer 0.

Itemset-Knoten Wahrscheinlichkeit des Itemsets.

Regelknoten Konfidenzwert für die Regel.

Marginalwahrscheinlichkeit
Identisch mit NODE_PROBABILITY.

KNOTENVERTEILUNG
Die Tabelle enthält sehr unterschiedliche Informationen, je nachdem, ob es sich bei dem Knoten um ein Itemset oder eine Regel handelt.

Übergeordneter Knoten Leer.

Itemset-Knoten Listet jedes Element im Itemset zusammen mit einem Wahrscheinlichkeits- und Unterstützungswert auf. Wenn das Itemset beispielsweise zwei Produkte enthält, wird der Name jedes Produkts zusammen mit der Anzahl der Fälle aufgeführt, die jedes Produkt enthalten.

Regelknoten Enthält zwei Zeilen. In der ersten Zeile wird das Attribut von der rechten Seite der Regel angezeigt, das vorhergesagte Element zusammen mit einem Konfidenzscore.

Die zweite Zeile ist für Zuordnungsmodelle einzigartig; enthält einen Zeiger auf das Itemset auf der rechten Seite der Regel. Der Zeiger wird in der spalte ATTRIBUTE_VALUE als ID des Itemsets dargestellt, das nur das rechte Element enthält.

Wenn die Regel beispielsweise lautet If {A,B} Then {C}, enthält die Tabelle den Namen des Elements {C}und die ID des Knotens, der das Itemset für Element C enthält.

Dieser Zeiger ist nützlich, da Sie anhand des Itemset-Knotens ermitteln können, wie viele Fälle insgesamt das auf der rechten Seite befindliche Produkt enthalten. Die Fälle, die der Regel If {A,B} Then {C} unterliegen, sind eine Teilmenge der Fälle, die im Elementesatz für {C} aufgeführt sind.

Node-Unterstützung
Die Anzahl der Fälle, die diesen Knoten unterstützen.

Übergeordneter Knoten Anzahl der Fälle im Modell.

Itemset-Knoten Anzahl der Fälle, die alle Elemente im Itemset enthalten.

Regelknoten Die Anzahl der Fälle, die alle Elemente enthalten, die in der Regel enthalten sind.

MSOLAP_MODEL_COLUMN
Enthält unterschiedliche Informationen, je nachdem, ob der Knoten ein Itemset oder eine Regel ist.

Übergeordneter Knoten Leer.

Itemset-Knoten Leer.

Regelknoten Die ID des Itemsets, das die Elemente auf der linken Seite der Regel enthält. Wenn die Regel beispielsweise lautet If {A,B} Then {C}, enthält diese Spalte die ID des Itemsets, das nur {A,B}enthält.

MSOLAP_NODE_SCORE
Übergeordneter Knoten Leer.

Itemset-Knoten Wichtigkeitsbewertung für das Itemset.

Regelknoten Wichtigkeitsbewertung für die Regel.

Hinweis

Die Wichtigkeit wird für Itemsets und Regeln unterschiedlich berechnet. Weitere Informationen finden Sie in der technischen Referenz zu Microsoft Association Algorithm.

MSOLAP_KNOTEN_KURZBESCHREIBUNG
Leer.

Siehe auch

Inhalt des Mining-Modells (Analysis Services - Data Mining)
Microsoft Association Algorithm
Beispiele für Zuordnungsmodellabfragen