Freigeben über


Ausnahmen hervorheben (Tabellenanalysetools für Excel)

Schaltfläche

Manchmal enthalten Ihre Daten möglicherweise eigenartige Werte. Beispielsweise kann das Alter eines Hausbesitzers als fünf Jahre alt angegeben werden. Diese Werte, häufig als Ausreißer bezeichnet, sind aufgrund eines Dateneingabefehlers möglicherweise falsch, oder sie weisen auf ungewöhnliche Trends hin. Ausnahmen können sich auf beide Arten auf die Qualität Ihrer Analyse auswirken. Das Tool "Ausnahmen hervorheben " hilft Ihnen, diese Werte zu finden und sie auf weitere Maßnahmen zu überprüfen.

Das Tool "Ausnahmen hervorheben " kann mit dem gesamten Datenbereich in einer Excel-Datentabelle arbeiten, oder Sie können nur einige Spalten auswählen. Sie können auch einen Schwellenwert anpassen, der die Streuung von Daten steuert, um mehr oder weniger Ausnahmen zu finden.

Wenn das Tool die Analyse abgeschlossen hat, wird ein neues Arbeitsblatt erstellt, das einen Zusammenfassungsbericht enthält, in dem aufgeführt wird, wie viele Ausreißer in den von Ihnen analysierten Spalten gefunden wurden. Das Tool hebt auch die Ausnahmen in der ursprünglichen Datentabelle hervor. Da das Tool allgemeine Trends analysiert, kann es feststellen, dass die meisten Werte in einer Zeile normal sind und nur eine Zelle in dieser Zeile hervorheben. Im obigen Beispiel für Hausbesitzer kann nur die Spalte "Alter " hervorgehoben werden.

Sie können auch den Schwellenwert für Ausnahme im Zusammenfassungsbericht ändern. Dieser Wert gibt die Wahrscheinlichkeit an, dass eine bestimmte Zelle einen abnormen Wert enthält. Wenn Sie den Wert erhöhen, werden daher weniger Werte als Ausreißer hervorgehoben. Umgekehrt werden beim Verringern des Werts weitere hervorgehobene Zellen angezeigt.

Verwenden des Tools "Ausnahmen hervorheben"

  1. Öffnen Sie eine Excel-Tabelle, und klicken Sie auf "Ausnahmen hervorheben".

  2. Geben Sie die zu analysierenden Spalten an.

  3. Klicken Sie auf Ausführen.

  4. Öffnen Sie das Arbeitsblatt mit dem Titel <Tabellennamen> Ausreißer, um eine Zusammenfassung der gefundenen Ausreißer anzuzeigen.

  5. Um die Anzahl der Hervorhebungen zu ändern, klicken Sie in der Zeile "Ausnahmeschwellenwert " des Berichts "Ausnahmen hervorheben" auf die Pfeile nach oben und unten.

Anforderungen

Sie können Spalten einschließen, die keine ungültigen Werte enthalten, wenn diese Werte Informationen enthalten, die bei der Vorhersage anderer Zeilen hilfreich sein könnten. Sie sollten jedoch die Auswahl von Spalten aufheben, die viele fehlende oder null Werte aufweisen.

Da alle ausgewählten Spalten zum Erstellen eines allgemeinen Musters verwendet werden, sollten Sie die Verwendung von Eingabespalten vermeiden, von denen Sie wissen, dass sie über schlechte Informationen verfügen, z. B. folgendes:

  • Spalten, die eindeutige Werte wie IDs enthalten.

  • Spalten, die einen hohen Prozentsatz falscher Werte enthalten.

  • Spalten mit vielen fehlenden Werten.

    Beachten Sie, dass es einige Fälle gibt, in denen es hilfreich ist, Eingabespalten mit vielen fehlenden Werten einzuschließen. Wenn beispielsweise der Wert des Adressfelds immer fehlt, wenn der Kunde über einen Händler kauft, kann der Data Mining-Algorithmus diese Informationen verwenden, um andere ähnliche Kunden zu identifizieren. Sie müssen fallweise ermitteln, ob Daten durch Auslassung fehlen oder weil der Fehlende Zustand sinnvoll ist.

  • Spalten, die voraussichtlich nicht nützlich sind, um ein Muster zu erstellen. Eine Spalte mit demselben Wert in jeder Zeile fügt beispielsweise keine Informationen hinzu, die bei Gebäudemustern nützlich wären.

Verständnis des Berichts über hervorgehobene Ausnahmen

Wenn Sie auf "Ausführen" klicken, führt das Tool drei Aktionen aus:

  • Erstellt eine Data Mining-Struktur basierend auf den aktuellen Daten in der Tabelle.

  • Erstellt ein neues Data Mining-Modell mithilfe des Microsoft Clustering-Algorithmus.

  • Erstellt eine Vorhersageabfrage basierend auf den Mustern, um zu bestimmen, ob Werte im Arbeitsblatt unvorstellbar sind.

Der Anfangswert für den Ausnahmeschwellenwert ist immer 75, d. h. der vom Algorithmus berechnete Algorithmus hat eine 75% Chance, dass die hervorgehobenen Daten falsch sind. Das Tool legt diesen Schwellenwert für den anfänglichen Analysedurchlauf automatisch fest, Sie können den Wert im Bericht jedoch ändern.

Das Tool "Ausnahmen hervorheben " hebt Zellen in der ursprünglichen Datentabelle hervor, die verdächtig sind. Dunkle Hervorhebung bedeutet, dass die Zeile Aufmerksamkeit benötigt. Eine helle Markierung bedeutet, dass der Wert in dieser bestimmten Zelle als auffällig identifiziert wurde. Wenn Sie den Schwellenwert für die Ausnahmen ändern, ändern sich die hervorgehobenen Werte entsprechend.

Das Zusammenfassungsdiagramm zeigt die Anzahl der Zellen in jeder Spalte, die sich über dem Ausnahmeschwellenwert befanden.

Wenn Sie Daten zur Vorbereitung auf Data Mining bereinigen oder überprüfen, können Sie auch die Datenexplorationsfeatures im Data Mining-Client für Excel ausprobieren. Dieses Add-In bietet erweiterte Tools, mit denen Sie Ausreißer finden, Daten neu bezeichnen oder die Verteilung von Daten anzeigen können. Weitere Informationen zu Datenerkundungstools im Data Mining-Client für Excel finden Sie unter Untersuchen und Bereinigen von Daten.

Das Tool "Ausnahmen hervorheben " verwendet den Microsoft Clustering-Algorithmus. Ein Clustermodell erkennt Gruppen von Zeilen, die ähnliche Merkmale aufweisen. Der Data Mining-Client für Excel bietet ein Durchsuchen-Fenster , in dem Diagramme und Merkmalsprofile verwendet werden, mit denen Sie Data Mining-Modelle untersuchen können, die durch Clustering erstellt wurden. Informationen zum Durchsuchen des Clusteringmodells, das vom Tool "Ausnahmen hervorheben" erstellt wurde, finden Sie unter Durchsuchen von Modellen (Data Mining-Client für Excel).

Weitere Informationen zum Microsoft Clustering-Algorithmus finden Sie im Thema "Microsoft Clustering Algorithm" in SQL Server Books Online.

Siehe auch

Tabellenanalysetools für Excel