Teststatistik
Eine Teststatistik, auch Prüfgröße,[1] Testgröße[2], Testprüfgröße, oder Prüffunktion genannt, ist eine spezielle reellwertige Funktion in der Testtheorie, einem Teilgebiet der mathematischen Statistik. Teststatistiken werden als Hilfsfunktionen bei der Definition von statistischen Tests verwendet. So wird beispielsweise bei einem Hypothesentest die Nullhypothese abgelehnt, wenn die Teststatistik über oder unter einem vorher festgelegten Zahlenwert liegt.
Definition
Gegeben sei eine Funktion
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle T \colon \mathcal X \to \R }
sowie ein statistischer Test
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \varphi \colon \mathcal X \to [0,1] } ,
der definiert ist durch
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \varphi(X)=\begin{cases} 1 & \text{ falls } \quad T(X) > k \\ 0 & \text{ falls } \quad T(X) \leq k \end{cases} } .
Hierbei ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle k} eine feste Zahl, die auch der kritische Wert genannt wird. Dann wird die Funktion Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle T } eine Teststatistik genannt.[3]
Die Definition gilt ebenso für randomisierte Tests sowie Varianten der obigen Definition des Tests. Dazu gehört unter anderem das Vertauschen oder Abändern von Ungleichheitszeichen und Vertauschen von null und eins.
Beispiele
z-Statistik
Unter Verwendung der Abkürzung
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \overline X = \frac 1n \left(X_1+X_2+ \ldots + X_n \right) }
für das Stichprobenmittel ist eine typische Teststatistik auf Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal X =\R^n } gegeben durch die z-Statistik
Hierbei ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma } eine positive Zahl und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu } eine beliebige reelle Zahl. Diese Teststatistik findet beispielsweise bei den Gauß-Tests Anwendung. Dabei wird ausgenutzt, dass die Teststatistik standardnormalverteilt ist, d. h. Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle T \sim \mathcal N(0,1) } , wenn die Stichprobenvariablen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X_1, X_2, \dots, X_n } normalverteilt sind mit Erwartungswert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu } und Varianz .[4]
t-Statistik
Bezeichnet man mit
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle V^*(X)= \frac{1}{n-1} \sum_{i=1}^n (X_i-\overline X )^2}
die korrigierte Stichprobenvarianz, so ist eine weitere wichtige Teststatistik auf gegeben durch
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle T(X)= \sqrt n \cdot \frac{\overline X-\mu}{\sqrt{V^*(X)}} } .
Hierbei ist wieder Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu } eine beliebige reelle Zahl. Diese Teststatistik findet bei dem Einstichproben-t-Test Anwendung. Dabei wird ähnlich zum obigen Beispiel ausgenutzt, dass wenn die Stichprobenvariablen normalverteilt sind mit Varianz Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2 } und Mittelwert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu } , die Teststatistik t-verteilt ist mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (n-1)} Freiheitsgraden. Es gilt dann Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle T \sim \mathbf t_{n-1} } .[5]
Chi-Quadrat-Summe
Eine dritte wichtige Teststatistik ist
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle T(X):= \sum_{i=1}^n \left( \frac{X_i-\mu}{\sigma}\right)^2}
Dabei ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu \in \R } und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma > 0 } . Sie wird beispielsweise beim Chi-Quadrat-Test für die Varianz verwendet. Dabei wird genutzt, dass Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle T } Chi-Quadrat-verteilt ist, wenn die Stichprobenvariablen normalverteilt sind mit Erwartungswert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu } und Varianz .[4]
Vorteile
Betrachtet man einen Test Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \varphi } und bezeichnet mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname E_{\vartheta} } die Bildung des Erwartungswertes bezüglich einer Wahrscheinlichkeitsverteilung Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle P_\vartheta } , so treten in der Testtheorie häufig Ausdrücke der Form
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname E_{\vartheta_0}(\varphi) } oder Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 1- \operatorname E_{\vartheta_1}(\varphi) }
auf. Dabei entspricht der erste Ausdruck dem Fehler 1. Art und der zweite dem Fehler 2. Art, wenn Fehler beim Parsen (Konvertierungsfehler. Der Server („https://wikimedia.org/api/rest_“) hat berichtet: „Cannot get mml. Server problem.“): {\displaystyle \vartheta _{0}} in der Nullhypothese ist und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \vartheta_1 } in der Alternative. Im Allgemeinen sind solche Ausdrücke schwer zu berechnen, da der Test Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \varphi } selbst wenig Struktur besitzt.
Geht man nun von einem nichtrandomisierten Test Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \varphi } aus (der randomisierte Fall folgt mit leichten Anpassungen), so lässt sich der Test schreiben als
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \varphi(X)=\mathbf 1_{A}(X) } .
Hierbei ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle A } der Ablehnbereich des Tests und Fehler beim Parsen (Konvertierungsfehler. Der Server („https://wikimedia.org/api/rest_“) hat berichtet: „Cannot get mml. Server problem.“): {\displaystyle \mathbf {1} _{A}(X)} die Indikatorfunktion auf der Menge Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle A } . Mit dieser Schreibweise folgt dann insbesondere
- Fehler beim Parsen (Konvertierungsfehler. Der Server („https://wikimedia.org/api/rest_“) hat berichtet: „Cannot get mml. Server problem.“): {\displaystyle \operatorname {E} _{\vartheta }(\varphi )=P_{\vartheta }(A)}
(siehe auch Verwendung zur Berechnung von Erwartungswert, Varianz und Kovarianz).
Ist der Test nun durch eine Teststatistik Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle T } definiert, also beispielsweise durch
- Fehler beim Parsen (Konvertierungsfehler. Der Server („https://wikimedia.org/api/rest_“) hat berichtet: „Cannot get mml. Server problem.“): {\displaystyle \varphi (X)={\begin{cases}1&{\text{ falls }}\quad T(X)>k\\0&{\text{ falls }}\quad T(X)\leq k\end{cases}}} ,
so ist der Ablehnbereich von der Form
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle A= \{ X \in \mathcal X \mid T(X) > k \} } .
Damit reduziert sich aber die Bestimmung des Erwartungswertes des Tests zu
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname E_\vartheta(\varphi)= P_\vartheta(A) =P_{\vartheta}( \{ X \in \mathcal X \mid T(X) > k \}) } .
Damit lässt sich der Erwartungswert des Tests direkt bestimmen, wenn die Verteilung der Teststatistik bekannt ist. Wie die drei obigen Beispiele zeigen ist dies bei vielen wichtigen Tests der Fall.
Die einfachere Berechnung des Erwartungswertes über die Verteilung der Teststatistik wird auf verschiedene Weisen verwendet. Einerseits bei Hypothesentests vor der Datenauswertung, um den kritischen Wert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle k } so anzupassen, dass der Test den gewünschten Fehler erster Art einhält. Andererseits bei Signifikanztests nach der Datenauswertung zur Bestimmung des p-Wertes. Somit erleichtern Teststatistiken den Umgang und die Konstruktion von Tests.
Einzelnachweise
- ↑ Wolfgang Tschirk: Statistik: Klassisch oder Bayes. Zwei Wege im Vergleich. 1. Auflage. Springer Spektrum, Berlin/Heidelberg 2014, ISBN 978-3-642-54384-5, S. 67, doi:10.1007/978-3-642-54385-2.
- ↑ Karl Bosch: Elementare Einführung in die angewandte Statistik. 8. Auflage. Vieweg, Wiesbaden 2005, S. 178.
- ↑ Testtheorie. In: Guido Walz (Hrsg.): Lexikon der Mathematik. 1. Auflage. Spektrum Akademischer Verlag, Mannheim/Heidelberg 2000, ISBN 3-8274-0439-8.
- ↑ a b Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, S. 195, doi:10.1007/978-3-642-41997-3.
- ↑ Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, S. 282, doi:10.1515/9783110215274.