Einseitiger Einstichproben-Gauß-Test
Der einseitige Einstichproben-Gauß-Test, verkürzt auch Einstichproben Gauß-Test,[1] auch einseitiger Gauß-Test[2] genannt, ist ein spezieller statistischer Test in der Testtheorie, einem Teilgebiet der mathematischen Statistik. In seiner Grundfassung testet er im Falle einer Normalverteilung mit unbekanntem Erwartungswert und bekannter Varianz, ob der Erwartungswert über oder unter einem vorgegebenen Schwellenwert liegt. Ist der Stichprobenumfang groß genug und kann angenommen werden, dass der zentrale Grenzwertsatz gilt, so kann der Test auch als approximativer Test verwendet werden. Getestet wird dann ebenfalls, ob der Erwartungswert einer unbekannten Verteilung über oder unter einem vorgegebenen Schwellenwert liegt.
Vorgehen
Kann angenommen werden, dass eine Normalverteilung mit Varianz vorliegt, so läuft der Test nach dem folgenden Schema ab:[3]
- Wähle einen Schwellenwert für den unbekannten Erwartungswert. Die Nullhypothese ist dann von der Form
- ,
- die Alternative von der Form
- Wähle eine Irrtumswahrscheinlichkeit , die dem Fehler 1. Art entspricht.
- Berechne den kritischen Wert
- .
- Hierbei ist das -Quantil der Standardnormalverteilung, das in der Quantiltabelle der Standardnormalverteilung nachgeschlagen werden kann. Des Weiteren ist die Anzahl der Elemente in der Stichprobe und die bekannte Varianz der zugrundeliegenden Normalverteilung.
- Bilde das arithmetische Mittel
- der Stichprobenelemente .
- Falls das arithmetische Mittel größer als der kritische Wert ist, also falls gilt: lehne die Nullhypothese ab. Ansonsten behalte die Nullhypothese bei.
Wählt man als Nullhypothese den rechten Teil der Zahlengeraden, also
und als Alternative entsprechend
- ,
so bleibt das allgemeine Vorgehen gleich. Jedoch wird bei der Bestimmung des kritischen Wertes das -Quantil durch das -Quantil ersetzt. Er berechnet sich dann zu
- .
Die Nullhypothese wird dann abgelehnt, wenn das arithmetische Mittel kleiner als der kritische Wert ist, also wenn gilt. Sie wird entsprechend beibehalten, wenn das arithmetische Mittel größer als der kritische Wert ist.[2]
Optimalität
Im oben beschriebenen Fall eine Normalverteilung mit unbekanntem Erwartungswert und bekannter Varianz sowie den oben verwendeten Hypothesen ist der einseitige Gauß-Test ein gleichmäßig bester Test. Dies bedeutet, dass er zu jedem beliebigen vorgegebenen Niveau immer einen kleineren Fehler 2. Art hat als alle anderen Tests für diese Situation.
Der Beweis beruht darauf, dass die Normalverteilung zur Exponentialfamilie gehört und einen monotonen Dichtequotienten besitzt. Dadurch lässt sich das Neyman-Pearson-Lemma für zweielementige Testprobleme mittels Monotonieargumenten auf die Menge der hier betrachteten Normalverteilungen ausweiten.
Mathematische Grundlage
Das zugrundeliegende statistische Modell ist
und wird auch als Normalverteilungsmodell bezeichnet. Es ist ein Produktmodell und formalisiert die oben implizit getroffene Annahme, dass die Stichprobenvariablen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X_1, X_2, \dots, X_n } unabhängig und identisch verteilt sind.
Dieses Modell ist die mathematische Formalisierung der Durchführung von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle n } identischen Experimenten, die sich nicht gegenseitig beeinflussen und deren Ausgang normalverteilt ist mit bekannten Varianz und unbekanntem Erwartungswert.
Der Test Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \varphi } der Nullhypothese Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle H_0= ( - \infty, \mu_0] } gegen die Alternative Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle H_1= (\mu_0, + \infty ) } beruht auf der Teststatistik
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle T(X)= \tfrac 1n \sum_{i=1}^n X_i } ,
dem sogenannten Stichprobenmittel. Es ist Normalverteilt zum unbekannten Mittelwert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu } und zur Varianz Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \tfrac{\sigma^2}{n} } , es gilt also
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle T(X) \sim \mathcal N(\mu, \tfrac{\sigma^2}{n}) } .
Dies folgt aus den Rechenregeln für Normalverteilte Zufallsvariablen. Der eigentliche statistische Test ist dann gegeben durch
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \varphi(X)= \begin{cases} 1 & \text{ falls } \quad T(X) > k \\ 0 & \text{ falls } \quad T(X) \leq k \end{cases} }
Hierbei ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle k } der kritische Wert. Durch ihn wird das Niveau (und damit der Fehler erster Art) festgelegt. Ist das Niveau als Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \alpha } vorgegeben, so errechnet sich der kritische Wert wie oben zu
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle k:= \mu_0+ u_{1- \alpha} \cdot \sqrt{\frac{\sigma^2}{n}} }
mit dem Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 1-\alpha} -Quantil Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle u_{1- \alpha} } der Standardnormalverteilung.
Der Ablehnbereich Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle A } des Tests ist somit
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle A= \{x \in \R^n \mid \overline x > k \} } ,
was in Vektorenschreibweise
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle A= \{x \in \R^n \mid \mathbf 1^T x > nk\} }
entspricht. Hierbei ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathbf 1 } der Einsvektor und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x=(x_1,x_2, \dots, x_n) } . Der Ablehnbereich bildet also einen Halbraum.
Die mathematischen Grundlagen für den analogen Test der Nullhypothese Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle H_0= [\mu_0, + \infty ) } gegen die Alternative Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle H_1= ( - \infty, \mu_0) } sind dieselben, lediglich die Ungleichheitszeichen im Test kehren sich um und der kritische Wert wird wie im oberen Abschnitt angegeben bestimmt.[4]
Abweichende Definitionen
In der Literatur findet sich sowohl die Definition des Tests als[2]
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \varphi(X)= \begin{cases} 1 & \text{ falls } \quad T(X) > k \\ 0 & \text{ falls }\quad T(X) \leq k \end{cases} }
als auch als[1]
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \varphi(X)= \begin{cases} 1 & \text{ falls } \quad T(X) \geq k \\ 0 & \text{ falls } \quad T(X) < k \end{cases} }
Die voneinander abweichenden Ungleichheitszeichen haben jedoch auf das Ergebnis des Tests keinen Einfluss, das immer Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle P(T(X)=k)=0 } gilt. Die Wahrscheinlichkeit, dass die Teststatistik genau den kritischen Wert annimmt und die beiden Definitionen somit verschiedene Werte annehmen ist gleich null und kann vernachlässigt werden.
Abgeleitetes Konfidenzintervall
Das aus dem Einstichproben Gauß-Test abgeleitete Konfidenzintervall zum Konfidenzniveau Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 1- \alpha } ist
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle C_1(X)= \left[ \overline X- u_{1- \alpha} \cdot \sqrt{\tfrac{\sigma_0^2 }{ n}} ; \infty \right) } .
beziehungsweise
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle C_2(X)= \left(- \infty; \overline X +u_{1-\alpha} \cdot \sqrt{\tfrac{\sigma_0^2 }{ n }} \right]} .
Dies folgt direkt aus der Dualität von Tests und Konfidenzbereichen. Die Konfidenzintervalle sind somit gleichmäßig beste Konfidenzintervalle.
Einzelnachweise
- ↑ a b Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, S. 195, doi:10.1007/978-3-642-41997-3.
- ↑ a b c Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, S. 276, doi:10.1515/9783110215274.
- ↑ Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, S. 265–266, doi:10.1515/9783110215274.
- ↑ Claudia Czado, Thorsten Schmidt: Mathematische Statistik. Springer-Verlag, Berlin Heidelberg 2011, ISBN 978-3-642-17260-1, S. 153, doi:10.1007/978-3-642-17261-8.