Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Ein Ausreißer bedeutet einen Datenwert, der aus einem der folgenden Gründe problematisch ist:
Der Wert liegt außerhalb des erwarteten Bereichs.
Daten wurden möglicherweise falsch eingegeben.
Wert fehlt.
Daten bestehen aus einem Leerzeichen oder einer anderen NULL-Zeichenfolge.
Der Wert ist genau, liegt jedoch weit außerhalb der Verteilung, die sich erheblich auf das Modell auswirken kann.
Der Data Mining-Client für Excel hilft Ihnen, diese Daten zu erkennen und dann die Werte zu aktualisieren oder zu unterdrücken. Sie können z. B. Ausreißer durch ein arithmetisches Mittel ersetzen oder Zeilen löschen, die potenziell falsche Werte enthalten.
Behandeln von Ausreißern
Der Assistent "Ausreißer entfernen" bietet Ihnen verschiedene Tools zum ordnungsgemäßen Behandeln von Ausreißern.
Zunächst können Sie die Daten untersuchen, um die Verteilung von Werten und die Beziehung der Ausreißer zu anderen Daten besser zu verstehen.
Sie können beispielsweise die Aufgabe "Daten durchsuchen" verwenden, um die Werte zu überprüfen und zu beheben. Der Assistent "Ausreißer entfernen " zeigt auch ein Diagramm an, entweder eine Linie oder ein Balkendiagramm, um die Verteilung aller Werte zu verstehen.
Als Nächstes können Sie den Ausreißer-Assistenten verwenden, um Ausreißer zu entfernen oder zu ändern. Die verwendete Methode hängt davon ab, ob die Werte diskret oder fortlaufend sind.
Der Assistent zeigt diskrete Werte in einem Balkendiagramm an, wobei jeder Balken einen bestimmten Wert darstellt, und die Höhe des Balkens gibt die Anzahl der Fälle für jeden Wert an. Durch Verschieben des Schiebereglers im Diagramm können Sie Balken ausblenden, die Gruppen extremer oder potenziell schlechter Werte darstellen.
Der Assistent zeigt fortlaufende Werte entweder in einem Balkendiagramm oder einem Liniendiagramm an. Im Liniendiagramm wird der Wert auf der X-Achse und die Anzahl der Werte auf der Y-Achse dargestellt.
Sie können steuern, ob Werte am unteren und hohen Ende des Diagramms entfernt oder beibehalten werden sollen, indem Sie die Minimal - und Höchstwerte ändern oder die Balken ziehen. Wenn Sie die Einstellungen für den Minimal- und Maximalwert ändern, werden die daten, die unterdrückt werden, durch Schattierung im Diagramm angezeigt.
Nachdem Sie ausgewählt haben, mit welchen Ausreißern Sie arbeiten sollen, teilen Sie dem Assistenten mit, wie die Ausreißer behandelt werden sollen. Sie können entweder die Zeilen löschen, die die Ausreißerwerte enthalten, oder Sie können einen Ersatzwert angeben, z. B. einen Mittelwert, einen Nullwert oder einen anderen Wert Ihrer Wahl.
Schließlich bietet Ihnen der Assistent einige Optionen zur Darstellung der neuen Daten an. Sie können die ursprünglichen Daten durch die neuen Werte ersetzen, der Tabelle eine neue Spalte hinzufügen, die die neuen Werte enthält, oder ein neues Arbeitsblatt erstellen, das die aktualisierten Daten enthält.
Den Ausreißer-Assistenten verwenden
Klicken Sie im Data Mining-Menüband auf "Daten bereinigen", und wählen Sie "Ausreißer" aus.
Wählen Sie im Dialogfeld "Quelldaten auswählen" eine Excel-Datentabelle oder einen Zellbereich aus, und klicken Sie auf "Weiter".
Warnung
Sie können den Ausreißer-Assistenten nicht für externe Daten verwenden, es sei denn, Sie kopieren ihn zuerst in Excel.
Wählen Sie im Dialogfeld " Spalte auswählen " eine einzelne Spalte aus.
Klicke auf Weiter.
Überprüfen Sie im Dialogfeld "Schwellenwerte angeben " die Verteilung der Daten.
Wenn die Spalte diskrete Werte enthält, zeigt der Assistent ein Histogramm an, das die Anzahl für jeden diskreten Wert enthält.
Unter der Annahme, dass Ausreißer seltene Werte sind, können Sie sie herausfiltern, indem Sie den Minimalwert ändern.
Wenn die Spalte numerische Daten enthält, können Sie auf die Schaltfläche " Als diskret anzeigen" oder auf die Schaltfläche " Als numerische Ansicht" klicken, um zwischen der Anzeige der Werte in einem Balken- oder Liniendiagramm zu wechseln.
Wählen Sie im Dialogfeld "Schwellenwerte angeben " den Datenbereich aus, den Sie beibehalten möchten, indem Sie einen Minimal- und Maximalwert eingeben oder die Schiebereglerleisten ziehen. Klicke auf Weiter.
Geben Sie im Dialogfeld " Ausreißerbehandlung " an, ob die Werte gelöscht oder ersetzt werden sollen, und klicken Sie auf "Weiter".
Geben Sie im Dialogfeld "Ziel auswählen " an, wo die neuen Daten gespeichert werden sollen.
Verwandte Optionen
Der Assistent stellt diese Optionen bereit:
| Optionen | Kommentar |
|---|---|
| Spalte auswählen | Sie können jeweils nur mit einer Spalte arbeiten. |
| Angeben der Behandlung von Schwellenwerten | Legen Sie einen Schwellenwert unter Verwendung von "Minimum " fest, um Werte auszuschließen, die in weniger Zeilen als dem Schwellenwert gefunden werden. Der Wert in "Minimum " ist anfangs gleich dem Wert mit den wenigsten Zeilen, und Sie können den Minimalwert nicht unter diesen Wert setzen. |
| Ausreißerbehandlung | Wenn Sie ausreißer löschen möchten, können Sie entweder die Daten im aktuellen Arbeitsblatt ändern oder eine Kopie der Daten in einem neuen Arbeitsblatt erstellen. |