Freigeben über


Zuordnungsassistent (Data-Mining-Client für Excel)

Assistent zum Zuordnen im Data Mining-Menüband

Der Assistent "Zuordnen" hilft Ihnen beim Erstellen eines Data Mining-Modells mithilfe des Microsoft Association Rules-Algorithmus. Solche Miningmodelle sind besonders nützlich für die Erstellung von Empfehlungssystemen.

Wie es funktioniert, überprüft der Microsoft Association Rules-Algorithmus ein Dataset, das aus Transaktionen oder Ereignissen besteht, und findet die Kombinationen, die häufig zusammen angezeigt werden. Es kann viele tausend Kombinationen geben, aber der Algorithmus kann angepasst werden, um mehr oder weniger zu finden und nur die wahrscheinlichsten Kombinationen beizubehalten.

Sie können zuordnungsanalyse auf viele Probleme anwenden. Die beliebteste Anwendung dieser Methode ist die Marktkorbanalyse, die einzelne Produkte findet, die häufig zusammen gekauft werden. Sie können diese Informationen dann verwenden, um Kunden Produkte basierend auf bereits gekauften Artikeln zu empfehlen.

Verwenden des Assistenten zum Zuordnen

  1. Klicken Sie im Data Mining-Menüband auf "Zuordnen".

  2. Wählen Sie auf der Seite " Quelldaten auswählen " eine Excel-Tabelle oder einen Datenbereich aus, und klicken Sie auf "Weiter".

    Die Beispieldatenarbeitsmappe enthält ein Beispiel auf der Registerkarte "Verknüpfen", wie Transaktionsdaten normalerweise angeordnet werden, wenn Beispielsweise mehrere Produkte in jeder Transaktion oder mehrere Einkaufsdatensätze pro Kunde vorhanden sind, die Sie analysieren möchten.

    Wenn Sie externe Daten verwenden möchten, um ein Zuordnungsmodell mithilfe des Assistenten zum Zuordnen zu erstellen, müssen Sie die Daten zuerst zu Excel hinzufügen und die Daten flacher gestalten . Weitere Informationen zum Vorbereiten von Daten für die Zuordnungsmodellierung finden Sie unter "Geschachtelte Tabellen (Analysis Services - Data Mining)" in SQL Server-Büchern Online.

  3. Wählen Sie auf der Seite "Zuordnung " die Spalte aus, die die Transaktion identifiziert.

    Bei Marktkorbmodellen stellt dieser Bezeichner die Einheit dar, die Sie modellieren möchten. Möchten Sie Elemente analysieren, die einzelne Kunden im Laufe der Zeit erworben haben, oder möchten Sie viele Transaktionen mit mehreren Kunden analysieren? Im ersten Fall würden Sie die Kunden-ID auswählen; in letzterem würden Sie die Bestellung oder eine andere Transaktions-ID auswählen.

  4. Wählen Sie für "Element" die Spalte aus, die die Elemente enthält, unter denen Sie Zuordnungen suchen müssen.

    Beispielsweise würden Sie in einem Marktkorbmodell ein Produktfeld auswählen, um zu analysieren, welche Produkte häufig zusammen gekauft werden. Wenn zu viele einzelne Produkte vorhanden sind, um sie effektiv zu korrelieren, können Sie eine Produktkategorie oder ein Unterkategoriefeld auswählen.

  5. In Schwellenwerten können Sie Werte festlegen, die die Ausgabe des Modells steuern oder beeinflussen:

    • Minimale Unterstützung. Gibt an, wie oft eine Gruppe von Elementen als wichtig betrachtet werden muss. Der Algorithmus ignoriert alle Elementkombinationen, die dieses Kriterium nicht erfüllen. So möchten Sie z. B. nur Itemsets anzeigen, bei denen die Elemente insgesamt mindestens 10 Mal zusammen angezeigt wurden.

    • Mindestregelwahrscheinlichkeit. Gibt den minimalen Wahrscheinlichkeitswert an, der für die Speicherung einer Regel erforderlich ist. Der gesamte Datensatz wird analysiert, um alle Kombinationen zu finden, und dann wird die Wahrscheinlichkeit berechnet. Wenn der Schwellenwert niedrig ist, kann der Assistent Elemente zuordnen, die nur lose korreliert sind. Wenn der Schwellenwert zu hoch ist, werden einige Zuordnungen möglicherweise weggelassen, da sie nicht über genügend unterstützende Daten verfügen.

    Im Allgemeinen hat das Ändern dieser Werte die folgenden Auswirkungen:

    • Wenn Sie den Wert für die Unterstützung verringern, erhöhen Sie die Anzahl der gefundenen Kombinationen.

    • Wenn Sie die maximale Unterstützung verringern, filtern Sie Elemente heraus, die so oft auftreten, dass sie wenig Bedeutung haben.

    • Wenn Sie die Wahrscheinlichkeit einer Regel verringern, senken Sie die Anforderungen, die eine Kombination erfüllen muss, um im Kontext des Gesamtdatensatzes als wichtig zu betrachten.

    Trinkgeld: Es empfiehlt sich, mehrere Miningmodelle mit unterschiedlichen Kombinationen von Unterstützung und Wahrscheinlichkeit zu erstellen. Um nachzuverfolgen, welche Einstellungen Sie für jedes Modell verwendet haben, können Sie den Dokumentmodell-Assistenten verwenden, der im Data Mining-Client für Excel verfügbar ist, und die Option "Detaillierter Bericht" verwenden. Weitere Informationen finden Sie unter Documenting Mining Models (Data Mining Add-Ins für Excel).

  6. Klicken Sie optional auf "Parameter ", um die Algorithmusparameter zu ändern und das Verhalten des Miningmodells anzupassen.

    Das Dialogfeld "Algorithmusparameter" enthält alle Parameter, die Sie im Assistenten festgelegt haben, sowie einige, die weniger häufig verwendet werden, z. B. MAXIMUM_SUPPORT. Informationen zur Verwendung dieser Parameter finden Sie in der technischen Referenz zu Microsoft Association Algorithm.

  7. Geben Sie auf der Seite "Fertig stellen " einen eindeutigen Namen für das Dataset und das Modell ein.

  8. In "Optionen" definieren Sie, wie Sie nach Abschluss des Modells mit dem Modell arbeiten möchten:

    • Durchsuchen. Wenn das Modell fertig ist, öffnet der Assistent ein Fenster, in dem die Regeln, die Itemsets und ein Abhängigkeitsnetzwerkdiagramm angezeigt werden, das Zuordnungen darstellt.

      Weitere Informationen zum Interpretieren der Daten im Zuordnungsmodell-Viewer finden Sie unter Browsen eines Zuordnungsregelnmodells.

    • Drillthrough aktivieren. Wählen Sie diese Option aus, um über das Modell Zugriff auf die zugrunde liegenden Daten zu erhalten.

      Drillthrough ist beispielsweise hilfreich, wenn Sie auf ein bestimmtes Itemset klicken und die Quelldaten anzeigen möchten.

    • Verwenden Sie temporäres Modell. Wählen Sie diese Option aus, wenn das Modell nicht auf dem Server gespeichert werden soll. Temporäre Modelle werden gelöscht, wenn Sie Excel schließen.

  9. Der Assistent analysiert alle möglichen Kombinationen und erstellt einen Bericht, der die Itemsets und Regeln enthält.

Weitere Informationen zu Zuordnungsmodellen

Der Microsoft Association Rules-Algorithmus untersucht die Schulungsdaten, um Elemente zu finden, die in einer Transaktion zusammen angezeigt werden. Jede Gruppe von Elementen stellt ein Itemset dar. Der Algorithmus zählt dann, wie oft jedes Itemset angezeigt wird, und berechnet die relative Wichtigkeit der einzelnen Itemset für alle Transaktionen.

Der Algorithmus verwendet diese Informationen zu Itemsets, um Regeln zu generieren, mit denen Zuordnungen vorhergesagt oder Empfehlungen erstellt werden können. Beispielsweise könnte eine Regel "wenn der Benutzer ein Buch von Author 1 und ein Buch von Author 2 erworben hat, dann ist es wahrscheinlich, dass der Benutzer auch ein Buch von Author 3 kauft". Jeder Empfehlung wird eine Wahrscheinlichkeit zugewiesen, basierend auf der Stärke der Zuordnungen.

Anforderungen

Um den Zuordnungsassistenten zu verwenden, müssen Sie mit einer Analysis-Services-Datenbank verbunden sein.

Die Quelldaten müssen als Transaktionstabelle organisiert werden. Die Quelldaten müssen eine Spalte enthalten, die den Transaktionsbezeichner enthält. Diese Spalte identifiziert jede Gruppe von Elementen. Die Transaktionsspalte muss sich in einer 1:n-Beziehung mit einer zweiten Spalte befinden, in der eine Element-ID die Namen oder ID-Nummern für die einzelnen Elemente in der Gruppe speichert.

Konzeptionell ist dies am einfachsten zu verstehen, indem sie das Beispiel für den Einkaufswagen zurückrufen. Wenn dem Einkaufswagen eine ID zugewiesen ist, dient die Einkaufswagen-ID als Bezeichner für die Transaktion. Jeder Artikel im Einkaufswagen, z. B. Kartoffeln oder Milch, ist Mitglied dieser Transaktion. Der Associate-Algorithmus kann Elemente über Transaktionen hinweg nachverfolgen, z. B. um zu bestimmen, wie oft Kartoffeln und Milch innerhalb einer einzelnen Transaktion angezeigt werden.

Die Quelldaten müssen nach der Transaktionsbezeichnerspalte sortiert werden.

Siehe auch

Erstellen eines Data Mining-Modells
Durchsuchen eines Zuordnungsregelnmodells
Einkaufskorbanalyse (Tabellenanalysetools für Excel)
Durchlauf des Abhängigkeitsnetzwerkdiagramms (Data Mining Add-Ins)