Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Eine Miningstruktur soll mehrere Miningmodelle unterstützen. Daher können Sie nach Abschluss des Assistenten die Struktur öffnen und neue Miningmodelle hinzufügen. Jedes Mal, wenn Sie ein Modell erstellen, können Sie einen anderen Algorithmus verwenden, die Parameter ändern oder Filter anwenden, um eine andere Teilmenge der Daten zu verwenden.
Hinzufügen neuer Miningmodelle
Wenn Sie den Data Mining-Assistenten zum Erstellen eines neuen Miningmodells verwenden, müssen Sie standardmäßig zuerst eine Miningstruktur erstellen. Der Assistent bietet Ihnen dann die Möglichkeit, der Struktur ein anfängliches Miningmodell hinzuzufügen. Sie müssen jedoch kein Modell sofort erstellen. Wenn Sie die Struktur nur erstellen, müssen Sie keine Entscheidung darüber treffen, welche Spalte als vorhersagbares Attribut verwendet werden soll, oder die Verwendung der Daten in einem bestimmten Modell. Stattdessen richten Sie einfach die allgemeine Datenstruktur ein, die Sie in Zukunft verwenden möchten, und später können Sie data Mining-Designer verwenden, um neue Miningmodelle hinzuzufügen, die auf der Struktur basieren.
Hinweis
In CREATE MINING MODEL beginnt die CREATE MINING MODEL-Anweisung mit dem Miningmodell. Das heißt, Sie definieren Ihre Wahl des Miningmodells, und Analysis Services generiert automatisch die zugrunde liegende Struktur. Später können Sie weiterhin neue Miningmodelle zu dieser Struktur hinzufügen, indem Sie die Anweisung ALTER STRUCTURE... ADD MODEL verwenden.
Auswählen eines Algorithmus
Wenn Sie einer vorhandenen Struktur ein neues Modell hinzufügen, sollten Sie zunächst einen Data Mining-Algorithmus auswählen, der in diesem Modell verwendet werden soll. Die Auswahl des Algorithmus ist wichtig, da jeder Algorithmus eine andere Art von Analyse durchführt und unterschiedliche Anforderungen hat.
Wenn Sie einen Algorithmus auswählen, der nicht mit Ihren Daten kompatibel ist, erhalten Sie eine Warnung. In einigen Fällen müssen Sie möglicherweise Spalten ignorieren, die nicht vom Algorithmus verarbeitet werden können. In anderen Fällen nimmt der Algorithmus automatisch die Anpassungen für Sie vor. Wenn Ihre Struktur beispielsweise numerische Daten enthält und der Algorithmus nur mit diskreten Werten arbeiten kann, werden die numerischen Werte für Sie in diskrete Bereiche gruppiert. In einigen Fällen müssen Sie die Daten möglicherweise zuerst manuell korrigieren, indem Sie einen Schlüssel auswählen oder ein vorhersagbares Attribut auswählen.
Sie müssen den Algorithmus nicht ändern, wenn Sie ein neues Modell erstellen. Häufig können Sie sehr unterschiedliche Ergebnisse erzielen, indem Sie denselben Algorithmus verwenden, aber die Daten filtern oder einen Parameter ändern, z. B. die Clustermethode oder die Mindestgröße des Itemsets. Es wird empfohlen, mit mehreren Modellen zu experimentieren, um zu sehen, welche Parameter die besten Ergebnisse erzielen.
Beachten Sie, dass alle neuen Modelle verarbeitet werden müssen, bevor Sie sie verwenden können.
Angeben der Verwendung von Spalten in einem neuen Miningmodell
Wenn Sie einer vorhandenen Miningstruktur neue Miningmodelle hinzufügen, müssen Sie angeben, wie jede Datenspalte vom Modell verwendet werden soll. Abhängig vom Typ des Algorithmus, den Sie für das Modell auswählen, werden einige dieser Optionen möglicherweise standardmäßig getroffen. Wenn Sie keinen Verwendungstyp für eine Spalte angeben, wird die Spalte nicht in die Miningstruktur einbezogen. Die Daten in der Spalte können jedoch weiterhin für die Drillthrough-Funktion verfügbar sein, sofern das Modell dies erlaubt.
Spalten aus der Miningstruktur, die vom Modell verwendet werden (es sei denn, sie sind auf "Ignorieren" gesetzt), müssen entweder ein Schlüssel, eine Eingabespalte oder eine vorhersagbare Spalte sein, deren Werte auch als Eingaben für das Modell verwendet werden.
Schlüsselspalten enthalten einen eindeutigen Bezeichner für jede Zeile in einer Tabelle. Einige Miningmodelle, z. B. basierend auf den Sequenzclustering- oder Zeitreihenalgorithmen, können mehrere Schlüsselspalten enthalten. Diese mehrfachen Schlüssel sind jedoch keine zusammengesetzten Schlüssel im relationalen Sinne, sondern müssen ausgewählt werden, damit Zeitreihen- und Sequenzclusteringanalysen unterstützt werden können.
Eingabespalten stellen die Informationen bereit, aus denen Vorhersagen erstellt werden. Der Data Mining-Assistent stellt das Feature "Vorschlagen " bereit, das aktiviert ist, wenn Sie eine vorhersagbare Spalte auswählen. Wenn Sie auf diese Schaltfläche klicken, wird der Assistent die vorhersagbaren Werte ermitteln und bestimmen, welche der anderen Spalten in der Struktur gute Variablen darstellen. Sie lehnt Schlüsselspalten oder andere Spalten mit vielen eindeutigen Werten ab und schlägt Spalten vor, die scheinbar mit dem Ergebnis korreliert werden.
Diese Funktion ist besonders praktisch, wenn Datensätze mehr Spalten enthalten, als Sie wirklich benötigen, um ein Miningmodell zu erstellen. Mit dem Feature "Vorschlagen " wird eine numerische Bewertung von 0 bis 1 berechnet, die die Beziehung zwischen jeder Spalte im Dataset und der vorhersagbaren Spalte beschreibt. Basierend auf dieser Bewertung schlägt das Feature Spalten vor, die als Eingabe für das Miningmodell verwendet werden sollen. Wenn Sie das Feature "Vorschlagen " verwenden, können Sie die vorgeschlagenen Spalten verwenden, die Auswahl an Ihre Anforderungen anpassen oder die Vorschläge ignorieren.
Vorhersagbare Spalten enthalten die Informationen, die Sie im Miningmodell vorhersagen möchten. Sie können mehrere Spalten als vorhersagbare Attribute auswählen. Clusteringmodelle sind die Ausnahme, dass ein vorhersagbares Attribut optional ist.
Je nach Modelltyp muss die vorhersagbare Spalte möglicherweise ein bestimmter Datentyp sein: Beispielsweise erfordert ein lineares Regressionsmodell eine numerische Spalte als prognostizierten Wert; Der Naïve Bayes-Algorithmus erfordert einen diskreten Wert (und alle Eingaben müssen ebenfalls diskret sein).
Angeben des Spalteninhalts
Bei einigen Spalten müssen Sie möglicherweise auch den Spalteninhalt angeben. In SQL Server Data Mining teilt die Content Type-Eigenschaft jeder Datenspalte dem Algorithmus mit, wie die Daten in dieser Spalte verarbeitet werden sollen. Wenn Ihre Daten beispielsweise über eine Spalte "Einkommen" verfügen, müssen Sie angeben, dass die Spalte fortlaufende Zahlen enthält, indem Sie den Inhaltstyp auf "Fortlaufend" festlegen. Sie können jedoch auch angeben, dass die Zahlen in der Spalte "Einkommen" in Buckets gruppiert werden, indem Sie den Inhaltstyp auf "Discretized" festlegen und optional die genaue Anzahl von Buckets angeben. Sie können unterschiedliche Modelle erstellen, die Spalten unterschiedlich verarbeiten: Sie können beispielsweise ein Modell ausprobieren, das Kunden in drei Altersgruppen einteilt, und ein anderes Modell, das Kunden in zehn Altersgruppen einteilt.
Siehe auch
Miningstrukturen (Analysis Services - Data Mining)
Erstellen einer relationalen Miningstruktur
Miningmodelleigenschaften
Spalten des Miningmodells