Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Data Mining ist ein Prozess, der die Interaktion mehrerer Komponenten umfasst.
Sie greifen auf Datenquellen in einer SQL Server-Datenbank oder auf eine andere Datenquelle zu, die für Schulungen, Tests oder Vorhersagen verwendet werden soll.
Sie definieren Data Mining-Strukturen und -Modelle mithilfe von SQL Server Data Tools (SSDT) oder Visual Studio.
Mithilfe von SQL Server Management Studio können Sie Data Mining-Objekte verwalten und Vorhersagen und Abfragen erstellen.
Wenn die Lösung abgeschlossen ist, stellen Sie sie in einer Instanz von Analysis Services bereit.
Der Prozess zum Erstellen dieser Lösungsobjekte wurde bereits an anderer Stelle beschrieben. Weitere Informationen finden Sie unter Data Mining-Projektmappen.
Data Mining-Quelldaten
Die Daten, die Sie im Data Mining verwenden, werden nicht in der Data Mining-Lösung gespeichert; nur die Bindungen werden gespeichert. Die Daten befinden sich möglicherweise in einer Datenbank, die in einer früheren Version von SQL Server, einem CRM-System oder sogar in einer Flachdatei erstellt wurde. Wenn Sie die Struktur oder das Modell durch die Verarbeitung trainieren, wird eine statistische Zusammenfassung der Daten erstellt und in einem Cache gespeichert, der zur Verwendung in späteren Vorgängen beibehalten oder nach der Verarbeitung gelöscht werden kann. Weitere Informationen finden Sie unter Mining-Strukturen (Analysis Services - Data Mining).
Sie kombinieren unterschiedliche Daten innerhalb des Analysis Services-Datenquellenansichtsobjekts (DSV), das eine Abstraktionsebene über der Datenquelle bereitstellt. Sie können Verknüpfungen zwischen Tabellen angeben oder Tabellen hinzufügen, die eine n:1-Beziehung aufweisen, um geschachtelte Tabellenspalten zu erstellen. Die Definition dieser Objekte, die Datenquelle und die Datenquellenansicht werden in der Lösung mit den Dateinamenerweiterungen *.ds und *.dsv gespeichert. Weitere Informationen zum Erstellen und Verwenden von Analysis Services-Datenquellen und Datenquellenansichten finden Sie unter "Datenquellen unterstützt(SSAS Multidimensional)".
Sie können Datenquellen und Datenquellenansichten auch mithilfe von AMO oder XMLA definieren und ändern. Weitere Informationen zum programmgesteuerten Arbeiten mit diesen Objekten finden Sie unter Logical Architecture Overview (Analysis Services – Multidimensional Data).For more information about working with these objects programmatically, see Logical Architecture Overview (Analysis Services - Multidimensional Data).
Bergbaustrukturen
Eine Data Mining-Struktur ist ein logischer Datencontainer, der die Datendomäne definiert, aus der Miningmodelle erstellt werden. Eine einzelne Miningstruktur kann mehrere Miningmodelle unterstützen.
Wenn Sie die Daten in der Data Mining-Lösung verwenden müssen, liest Analysis Services die Daten aus der Quelle und generiert einen Cache von Aggregaten und anderen Informationen. Standardmäßig wird dieser Cache beibehalten, sodass Schulungsdaten wiederverwendet werden können, um zusätzliche Modelle zu unterstützen. Wenn Sie den Cache löschen müssen, ändern Sie die Eigenschaft CacheMode des Miningstrukturobjekts in den Wert ClearAfterProcessing. Weitere Informationen finden Sie unter AMO Data Mining Classes.
SQL Server 2014 Analysis Services (SSAS) bietet auch die Möglichkeit, Ihre Daten in Schulungs- und Testdatensätze zu trennen, sodass Sie Ihre Miningmodelle auf einem repräsentativen, zufällig ausgewählten Datensatz testen können. Die Daten werden nicht separat gespeichert; Stattdessen werden Falldaten im Strukturcache mit einer Eigenschaft markiert, die angibt, ob der jeweilige Fall für Schulungen oder zum Testen verwendet wird. Wenn der Cache gelöscht wird, können diese Informationen nicht abgerufen werden.
Weitere Informationen finden Sie unter Mining-Strukturen (Analysis Services – Data Mining).
Eine Data Mining-Struktur kann geschachtelte Tabellen enthalten. Eine geschachtelte Tabelle enthält zusätzliche Details zum Fall, der in der primären Datentabelle modelliert ist. Weitere Informationen finden Sie unter "Geschachtelte Tabellen" (Analysis Services – Data Mining)
Miningmodelle
Vor der Verarbeitung ist ein Data Mining-Modell nur eine Kombination aus Metadateneigenschaften. Diese Eigenschaften geben eine Miningstruktur an, geben einen Data Mining-Algorithmus und eine definieren Sammlung von Parameter- und Filtereinstellungen an, die sich auf die Verarbeitung der Daten auswirken. Weitere Informationen finden Sie unter Mining-Modelle (Analysis Services - Data Mining).
Beim Verarbeiten des Modells werden die Schulungsdaten, die im Cache der Miningstruktur gespeichert wurden, verwendet, um Muster zu generieren, basierend auf statistischen Eigenschaften der Daten und auf heuristischen Daten, die vom Algorithmus und seinen Parametern definiert werden. Dies wird als Trainieren des Modells bezeichnet.
Das Ergebnis der Schulung ist eine Reihe von Zusammenfassungsdaten, die im Modellinhalt enthalten sind, der die gefundenen Muster beschreibt und Regeln bereitstellt, mit denen Vorhersagen generiert werden. Weitere Informationen finden Sie unter Mining Model Content (Analysis Services – Data Mining).
In begrenzten Fällen kann die logische Struktur des Modells auch in eine Datei exportiert werden, die Modellformeln und Datenbindungen gemäß einem Standardformat darstellt, der Predictive Modeling Markup Language (PMML). Diese logische Struktur kann in andere Systeme importiert werden, die PMML nutzen, und das so beschriebene Modell kann dann für Vorhersagen verwendet werden. Weitere Informationen finden Sie unter Understanding the DMX Select Statement.
Benutzerdefinierte Data Mining-Objekte
Andere Objekte, die Sie im Kontext eines Data Mining-Projekts verwenden, z. B. Genauigkeitsdiagramme oder Vorhersageabfragen, werden nicht innerhalb der Lösung beibehalten, können jedoch mithilfe von ASSL oder mit AMO erstellt werden.
Darüber hinaus können Sie die in einer Instanz von Analysis Services verfügbaren Dienste und Features erweitern, indem Sie diese benutzerdefinierten Objekte hinzufügen:
Benutzerdefinierte Assemblys
.NET-Assemblys können mithilfe einer beliebigen CLR-oder COM-Beschwerdesprache definiert und dann mit einer Instanz von SQL Server registriert werden. Assemblydateien werden vom von der Anwendung definierten Speicherort geladen, und eine Kopie wird zusammen mit den Daten auf dem Server gespeichert. Die Kopie der Assemblydatei wird verwendet, um die Assembly jedes Mal zu laden, wenn der Dienst gestartet wird.
Weitere Informationen finden Sie unter Multidimensional Model Assemblies Management.
Benutzerdefinierte gespeicherte Prozeduren
Analysis Services Data Mining unterstützt die Verwendung von gespeicherten Prozeduren zum Arbeiten mit Data Mining-Objekten. Sie können eigene gespeicherte Prozeduren erstellen, um Funktionen zu erweitern und einfacher mit Daten zu arbeiten, die von Vorhersageabfragen und Inhaltsabfragen zurückgegeben werden.
Definieren gespeicherter Prozeduren
Die folgenden gespeicherten Prozeduren werden zur Verwendung bei der Kreuzüberprüfung unterstützt.
Gespeicherte Data Mining-Prozeduren (Analysis Services - Data Mining)
Darüber hinaus enthält Analysis Services viele gespeicherte Systemprozeduren, die intern für Data Mining verwendet werden. Obwohl die vom System gespeicherten Prozeduren für die interne Verwendung geeignet sind, finden Sie möglicherweise nützliche Tastenkombinationen. Microsoft behält sich das Recht vor, diese gespeicherten Prozeduren nach Bedarf zu ändern; Daher wird empfohlen, für die Produktionsverwendung Abfragen mithilfe von FEATURE, AMO oder XMLA zu erstellen.
Benutzerdefinierte Plug-In-Algorithmen
Analysis Services bietet einen Mechanismus zum Erstellen eigener Algorithmen und anschließendes Hinzufügen der Algorithmen als neuen Data Mining-Dienst zur Serverinstanz.
Analysis Services verwendet COM-Schnittstellen für die Kommunikation mit Plug-In-Algorithmen. Weitere Informationen zum Implementieren neuer Algorithmen finden Sie unter Plug-In-Algorithmen.
Sie müssen jeden neuen Algorithmus registrieren, bevor Sie ihn verwenden können. Um einen Algorithmus zu registrieren, fügen Sie die erforderlichen Metadaten für die Algorithmen in der .ini Datei der Instanz von Analysis Services hinzu. Sie müssen jeder Instanz, in der Sie den neuen Algorithmus verwenden möchten, die Informationen hinzufügen. Nachdem Sie den Algorithmus hinzugefügt haben, können Sie die Instanz neu starten und das MINING_SERVICES Schema-Rowset verwenden, um den neuen Algorithmus anzuzeigen, einschließlich der Optionen und Anbieter, die der Algorithmus unterstützt.
Siehe auch
Verarbeitung von Objekten im multidimensionalen Modell
Data Mining Extensions (EXTENSIONS) Referenz