Goldfeld-Quandt-Test
Der Goldfeld-Quandt-Test ist ein statistischer Test auf Heteroskedastizität (nicht konstante Varianz der Störgrößen) bei der Regressionsanalyse. Der Test basiert auf dem Vergleich zweier Stichprobenhälften. Er wurde benannt nach Stephen Goldfeld und Richard E. Quandt.[1]
Vorgehen
Die Stichprobe wird in zwei Teilmengen bzgl. einer erklärenden Variablen geteilt, siehe Grafik. Die beiden Teilmengen müssen disjunkt sein, sodass keine Beobachtung in beiden Teilmengen vorkommen. Die beiden Teilmengen zusammen müssen aber nicht die gesamte Stichprobe umfassen. In der Grafik ist z. B. der Mittelteil der Beobachtungen in keiner Teilmenge (grau). Für beide Teilmengen wird eine Regression geschätzt und die Varianz der Residuen berechnet. Danach wird für jede Teilmenge die Stichprobenvarianz der Residuen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle {s_i^2}} für i=1,2 bestimmt (mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle s_1^2>s_2^2} ) und der Prüfwert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \tfrac{s_1^2}{s_2^2}} mit einem kritischen Wert aus der F-Verteilung verglichen. In dem Beispiel liegt Heteroskedastizität vor, da die Regression zu einer Teilmenge eine hohe Residualvarianz (rot) aufweisen, während die Regression zur anderen Teilmenge eine niedrige Residualvarianz (blau) zeigt.
Mathematische Formulierung
Voraussetzung
Im klassischen Regressionsmodell gilt Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle Y_{i1}=f_1(x_{i1})+U_{i1}} bzw. Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle Y_{i2}=f_2(x_{i2})+U_{i2}} mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle U_{i1}\sim \mathcal{N}(0, \sigma_1^2)} und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle U_{i2}\sim \mathcal{N}(0, \sigma_2^2)} . Der Test reagiert sensitiv auf Verletzungen der Normalverteilung der Residuen.
Hypothesen und Teststatistik
Die Null - und die Alternativhypothese lauten
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle H_0: \sigma_1^2=\sigma_2^2=\sigma^2,} (Vorliegen von Homoskedastizität) vs. Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle H_1: \sigma_1^2\neq\sigma_2^2} (Vorliegen von Heteroskedastizität).
Die Verteilung der Teststatistik ergibt sich als
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle F=\frac{S_1^2}{S_2^2}\sim F_{n_1-k;n_2-k}}
mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle n_i} die Anzahl der Beobachtungen im Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle i} ten Teil und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle k} die Anzahl der geschätzten Regressionsparameter sowie
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle S_i^2 = \frac{1}{n_i-k} \sum_{j=1}^{n_i} U_{ji}^2} .
Die Nullhypothese (Homoskedastizität) wird verworfen, wenn der Prüfwert größer ist als der kritische Wert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle F_{n_1-k;n_2-k}(1-\alpha)} aus der F-Verteilung mit Fehler beim Parsen (Konvertierungsfehler. Der Server („https://wikimedia.org/api/rest_“) hat berichtet: „Cannot get mml. Server problem.“): {\displaystyle n_{1}-k} und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle n_2-k} Freiheitsgraden und einem vorgegebenen Signifikanzniveau Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \alpha} .
Beispiel
Variable | Bedeutung |
---|---|
medv | Mittlerer Kaufpreis eines Hauses in 1000 US$ |
lstat | Anteil Unterschichtbevölkerung |
rm | Durchschnittliche Raumzahl |
dis | Gewichtete Entfernung zu den fünf wichtigsten Beschäftigtenzentren |
Für das Beispiel wurden lineare Regressionen mit dem Boston-Housing-Datensatz durchgeführt. Für jeden der 506 Bezirke wurden die rechts stehenden Variablen erhoben und eine multiple lineare Regression durchgeführt:
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle medv_i=2,8083-0{,}7233 lstat_i + 4{,}8734 rm_i -0{,}4613 dis_i + \hat{u}_i} .
Plottet man die Residuen gegen die Variable dis (Grafik oben) so sieht man, dass die Varianz der Residuen abnimmt, wenn die Werte von dis zunehmen. Man teilt die Daten nun in zwei Teile: den roten und den blauen Teil. Dann fittet man zwei Regressionsmodelle und berechnet die Summe der quadrierten Residuen.
Rot | |
---|---|
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle s_1^2=\frac1{n_1-k}\sum_{i=1}^{n_1} \hat{u}_{i1}^2 = \frac{4899{,}807}{112-4}=45{,}369} | |
Blau | Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle medv_{i2}=-40{,}858-0{,}044 lstat_{i2}+9{,}895 rm_{i2} +0{,}233 dis_{i2} + \hat{u}_{i2}} |
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle s_2^2=\frac1{n_2-k}\sum_{i=1}^{n_2} \hat{u}_{i2}^2 = \frac{179{,}927}{49-4}=3{,}998} |
Dann ergibt sich der Prüfwert zu Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle f=\tfrac{45{,}369}{3,998}=11{,}347} und der kritische Wert für ein Signifikanzniveau Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \alpha=5\,\%} aus der F-Verteilung mit 108 und 45 Freiheitsgraden zu Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle c=1{,}548} . Da der Prüfwert größer ist als der kritische Wert, muss die Nullhypothese der Homoskedastizität abgelehnt werden.
Literatur
- William E. Griffiths, R. Carter Hill, George G. Judge: Learning and Practicing Econometrics. 1. Auflage. 1993, ISBN 0-471-51364-4, S. 494 ff.
Einzelnachweise
- ↑ Stephen M. Goldfeld, R. E. Quandt: Some Tests for Homoscedasticity. In: Journal of the American Statistical Association. 60, Nr. 310, Juni 1965, S. 539–547. JSTOR 2282689. doi:10.1080/01621459.1965.10480811.