Hypothesentests für Daten Ausreißer

Mehrere formale statistische Tests, die Daten Ausreißer erkennen sind entworfen, um. Drei von ihnen haben die Form von Hypothesentests. Eine Hypothese-Test ist ein Verfahren zur Bestimmung, ob ein Satz kann anhand von Beispieldaten zurückgewiesen werden. Hypothesentests immer beinhalten eine Teststatistik aus den Daten zu einer geeigneten Verteilung zu vergleichen, um zu bestimmen, ob eine gegebene Hypothese durch die Daten gestützt wird.

Menu

Grubbs-Test

Mit einem Grubbs-Test, übernehmen Sie, dass der Datensatz für Ausreißer getestet normal verteilt ist. Die Null und alternative Hypothesen sind wie folgt:

H0: Es gibt keine Ausreißer.
H1: Es gibt mindestens einen Ausreißer.

Die Teststatistik ist wie folgt:

bild0.jpg

woher

G = Die Teststatistik für die Grubbs-Test
Yi = Ein einzelnes Element im Datensatz getestet
Y = Die Probe bedeuten
s = Die Probe Standardabweichung

Die Teststatistik erzeugt das Probenelement, das am weitesten von der Probe Mittelwert (positiv oder negativ) als Standardabweichungen ausgedrückt. Wenn beispielsweise die Probe Mittelwert 5 ist, ist der größte Probenelement 11 und der Proben-Standardabweichung 2 ist, dann würde die Teststatistik sein (11-5) / 2 = 6/2 = 3 Standardabweichungen vom Mittelwert .

Der kritische Wert ist wie folgt:

image1.jpg

Woher

n ist die Größe des von der Population gezogenen Probe.
t Ein Wert aus der Studenten gezogen ist t-Verteil- es einen rechten Heckbereich gleich dem Niveau der Bedeutung hat und n - 2 Freiheitsgraden (df).

Der Test kann durchgeführt werden, um zu bestimmen, ob ein Ausreißer ist, ob der Maximalwert ist ein Ausreißer, ob der Minimalwert ein Ausreißer ist, und so weiter.

Zum Beispiel zeigt die folgende, die Ergebnisse von Grubbs-Test auf die SP 500 zurückkehrt 2009-2013 Anwendung. Der Test wird durchgeführt, eine einzelne Ausreißer zu finden. Grubbs Testergebnisse für einen Ausreißer:

Daten: SPReturns
G = 3,8509, U = 0,9404, p-Wert = 0,01177
Alternative Hypothese: Niedrigster Wert -,0253283545257448 ist ein Ausreißer

Mit einem Signifikanzniveau von gleich 0,05 und einem p-Wert von 0,01177, ist der p-Wert unter dem Signifikanzniveau. Daher wird die Nullhypothese keine Ausreißer verworfen. Darüber hinaus zeigt der Test an, dass der Minimalwert im Datensatz ein Ausreißer ist.

Chi-Quadrat-Test

Sie können mit dem Chi-Quadrat-Verteilung für Ausreißer testen. Die Null und alternative Hypothesen sind wie folgt:

H0: Es gibt keine Ausreißer.
H1: Es gibt mindestens einen Ausreißer.

Die Teststatistik ist zwischen den tatsächlichen Mitgliedern eines Datensatzes und den entsprechenden Mitgliedern eines angenommenen Wahrscheinlichkeitsverteilung, wie die normalen auf den Differenzen basiert.

Zum Beispiel zeigt die folgende, die Ergebnisse des Chi-Quadrat-Test auf die SP 500 zurückkehrt 2009-2013 Anwendung:

Chi-Quadrat-Test für Ausreißer
Daten: SPReturns
X-squared = 14,8292, p-Wert = 0,01177
Alternative Hypothese: Niedrigster Wert -,0253283545257448 ist ein Ausreißer

Mit einem Signifikanzniveau von gleich 0,05 und einem p-Wert von 0,01177, ist der p-Wert unter dem Signifikanzniveau. Daher wird die Nullhypothese keine Ausreißer verworfen. Darüber hinaus zeigt der Test an, dass der Minimalwert im Datensatz ein Ausreißer ist.

Dixon Q-Test

Mit Dixon Q-Test, vorausgesetzt, dass Sie die Datenmenge für Ausreißer getestet normal verteilt ist. Die Null und alternative Hypothesen sind wie folgt:

H0: Es gibt keine Ausreißer.
H1: Es gibt mindestens einen Ausreißer.

Die Teststatistik ist wie folgt:

image2.jpg

Spalt bezieht sich auf den Absolutwert der Differenz zwischen einem Ausreißer und dem nächstliegenden Wert in dem Datensatz. Angebot bezieht sich auf die Differenz zwischen dem größten Wert in dem Datensatz und dem kleinsten Wert im Datensatz.

Einer der Nachteile zu Dixons Q-Test ist, dass man es nur auf eine Probe anwenden können zwischen 3 und 30 Beobachtungen enthält.

Im Folgenden werden die Ergebnisse der während der ersten 30 Handelstage des Jahres 2009 Dixon Q-Test auf die SP 500 zurückkehrt Anwendung:

Dixon-Test für Ausreißer
Daten: SPR
Q = 0,4359, p-Wert = 0,03185
Alternative Hypothese: Niedrigster Wert -,0116057775514049 ist ein Ausreißer

Mit einem Signifikanzniveau von gleich 0,05 und einem p-Wert von 0,03185, ist der p-Wert unter dem Signifikanzniveau. Daher wird die Nullhypothese keine Ausreißer verworfen. Darüber hinaus zeigt der Test an, dass der Minimalwert im Datensatz ein Ausreißer ist.

Menü