Grubbs-Beck-Test

Aus MM-Stat
Wechseln zu: Navigation, Suche

Theorie

Grubbs-Beck-Test[1]
Zweck Univariater Ausreißertest zur Prüfung auf zwei Ausreißer
Voraussetzung(en) X ist normalverteilt in der Grundgesamtheit
Hypothesen H_0: x_{(1)}, x_{(2)} sind keine Ausreißer

H_1: x_{(1)}, x_{(2)} sind Ausreißer
(linksseitiger Test)||H_0: x_{(n-1)}, x_{(n)} sind keine Ausreißer
H_1: x_{(n-1)}, x_{(n)} sind Ausreißer
(rechtsseitiger Test)

Teststatistik V = \frac{S_{3,n}}{S_ {1,n}} V = \frac{S_{1,n-2}}{S_{1,n}}
Ablehnungsbereich H_0  v > c_{n;\alpha}  v > c_{n;\alpha}
Notation S_{i,j}=\sum_{k=i}^j (X_k-\bar{X}_{i,j})^2 und \bar{X}_{i,j}=\frac1{j-i+1}\sum_{k=i}^j X_k


Umfangreiche Tabellen mit kritischen Werten für den Grubbs-Beck-Test finden sich bei Grubbs und Beck (1972)[1]. Eine Auswahl dieser wird in folgender Tabelle dargestellt:[2]

Kritische Werte c_{n;\alpha} für den Grubbs-Beck-Test[1]
n 5 6 7 8 9 10 12 15 20 30 40 50 100
c_{n;0,05} 0,018 0,056 0,102 0,148 0,191 0,231 0,300 0,382 0,480 0,601 0,672 0,720 0,833
c_{n;0,01} 0,004 0,019 0,044 0,075 0,108 0,141 0,204 0,286 0,391 0,527 0,610 0,667 0,802

Beispiel

Von 25 Personen wurde der Intelligenzquotient ermittelt: 84, 56, 119, 130, 124, 112, 88, 97, 148, 93, 96, 124, 122, 85, 137, 114, 93, 103, 125, 124, 67, 136, 97, 113 und 104. Das arithmetische Mittel und die Standardabweichung ergeben sich \bar{x}=107,65 und s=22,29. Für den Test ob die beiden kleinsten Werte Ausreisser sind ergibt sich der Prüfwert zu v=\tfrac{496,823}{7235,217}=0,606. Der kritische Wert zum Signifikanzniveau \alpha=0,05 ergibt sich zu c\approx 0,54>v mit c_{25;0.05}\approx \tfrac{c_{20;0,05}+c_{30;0.05}}{2}. Damit kann die Nullhypothese H_0 nicht verworfen werden.

Software

R

Paket outliers
grubbs.test(x, type=20, opposite=FALSE, two.sided=FALSE)
Der Test kann nur mit 3 bis 30 Beobachtungen durchgeführt werden.

Beispiele

Das Programm führt den Test für die beiden kleinsten (wenn \bar{x}-x_{(1)}>x_{(n)}-\bar{x}) bzw. größten Werte (wenn x_{(n)}-\bar{x}>\bar{x}-x_{(1)}) durch.

> library("outliers")
> IQ <- c(84, 56, 119, 130, 124, 112, 88, 97, 148, 93, 96, 124, 122, 85, 137, 114, 93, 103, 125, 124, 67, 136, 97, 113, 104)
> grubbs.test(IQ, type=20)

	Grubbs test for two outliers

data:  IQ
U = 0.60679, p-value = 0.1312
alternative hypothesis: lowest values 56 , 67 are outliers

Das Programm führt den Test für die beiden größten (wenn \bar{x}-x_{(1)}>x_{(n)}-\bar{x}) bzw. kleinsten Werte (wenn x_{(n)}-\bar{x}>\bar{x}-x_{(1)}) durch.

> library("outliers")
> IQ <- c(84, 56, 119, 130, 124, 112, 88, 97, 148, 93, 96, 124, 122, 85, 137, 114, 93, 103, 125, 124, 67, 136, 97, 113, 104)
> grubbs.test(IQ, type=20, opposite=T)

	Grubbs test for two outliers

data:  IQ
U = 0.77337, p-value = 0.7765
alternative hypothesis: highest values 137 , 148 are outliers

Der p-Wert ist in beiden Fällen größer als das vorgegebene Signifikanzniveau von 0,05 und daher können die Nullhypothesen nicht verworfen werden.

Einzelnachweise

  1. 1,0 1,1 1,2 Grubbs, F.E., Beck, G. (1972) Extension of sample sizes and percentage points for significance tests of outlying observations, Technometrice 14(4), 847-854
  2. Hartung, J. (2002) Statistik - Lehr- und Handbuch der angewandten Statistik (13. Auflage), R. Oldenbourg Verlag, 347