Gleichmäßig bester Test
Ein gleichmäßig bester Test (GB-Test), gleichmäßig trennschärfster Test, gleichmäßig schärfster Test, gleichmäßig mächtigster Test, oder kurz bester Test ist ein spezieller statistischer Test in der Testtheorie, einem Teilgebiet der mathematischen Statistik. Gleichmäßig beste Tests zeichnen sich dadurch aus, dass die Wahrscheinlichkeit für einen Fehler 1. Art immer unter einer vorgegebenen Grenze liegt, gleichzeitig aber die Wahrscheinlichkeit für ein Fehler 2. Art kleiner ist als die jedes weiteren Tests, der ebenfalls die vorgegebene Grenze für den Fehler 1. Art einhält. Nachteil an gleichmäßig besten Tests ist, dass sie im Gegensatz zu anderen Klassen von optimalen Schätzern wie strengen Tests und Maximin-Tests nur unter sehr eingeschränkten Rahmenbedingungen existieren.
Teils findet sich auch die Bezeichnung als UMP-Test, die aus dem Englischen von Uniform Most Powerful (gleichmäßig trennschärfster bzw. gleichmäßig mächtigster) abgeleitet ist.
Definition
Gegeben sei ein Statistisches Modell Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (X; \mathcal A, (P_\vartheta)_{\vartheta \in \Theta}) } sowie eine disjunkte Zerlegung von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Theta } in Nullhypothese Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Theta_0 } und Alternative Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Theta_1 } . Sei Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal T_\alpha } die Menge aller statistischen Tests zum Niveau Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \alpha } , das heißt alle Statistiken
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Phi \colon X \to [0,1] } ,
für die
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sup_{\vartheta \in \Theta_0} \operatorname E_\vartheta (\Phi)\leq \alpha }
gilt. Sei
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle G_\Phi(\vartheta):=\operatorname E_\vartheta(\Phi) }
die Gütefunktion des Tests Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Phi } . Der Test Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Psi \in \mathcal T_\alpha} heißt dann ein gleichmäßig bester Test (oder gleichmäßig trennschärfster Test) zum Niveau Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \alpha } , wenn für alle weiteren Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Phi \in \mathcal T_\alpha } die Trennschärfe von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Psi } größer ist als die Trennschärfe von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Phi } . Es gilt also
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle G_\Psi(\vartheta) \geq G_\Phi(\vartheta) \quad \mathrm{f\ddot ur \;alle\;} \vartheta \in \Theta_1 } .
Alternativ kann ein gleichmäßig bester Test auch definiert werden als derjenige Test, dessen Gütefunktion auf der Alternative mit der einhüllenden Gütefunktion (englisch envelope power function) von übereinstimmt.
Existenz
Gleichmäßig beste Tests müssen im Allgemeinen nicht existieren. Wichtigstes Hilfsmittel zur Herleitung von Existenzaussagen und zur Konstruktion von gleichmäßig besten Tests ist das Neyman-Pearson-Lemma, das teils auch das Fundamentallemma der mathematischen Statistik genannt wird.
Einfache Hypothesen
Für Tests mit einfachen Hypothesen, also einer einelementigen Nullhypothese und einer einelementigen Alternative liefert das Neyman-Pearson-Lemma die Existenz eines gleichmäßig besten Tests zu einem vorgegebenen Niveau . Dieser Test ist der Neyman-Pearson-Test, ein Likelihood-Quotienten-Test. Einzige zusätzliche Voraussetzung ist die Existenz der Wahrscheinlichkeitsdichtefunktionen von Nullhypothese und Alternative.
Nach dem Lemma von Stein konvergiert die Trennschärfe des Neyman-Pearson-Tests mit exponentieller Geschwindigkeit bei wachsender Stichprobengröße gegen .
Einseitige Tests
In einparametrigen Modellen mit monotonem Dichtequotient in Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle T } existiert ein gleichmäßig bester einseitiger Test zu einem vorgegebenen Niveau , also ein Test bei dem Nullhypothese und Alternative von der Form
sind. Dabei ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Theta \subset \R } und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \vartheta_0 } eine vorgegebene Zahl aus . Der Test ist dann gegeben durch
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Phi(x):= \begin{cases} 0 & \text{ falls } \quad T(x)< c \\ l & \text{ falls } \quad T(x)=c \\ 1 & \text{ falls } \quad T(x)> c \end{cases} } .
Dabei sind Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle c,l } so zu wählen, dass die Bedingung Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname E_{\vartheta_0}(\Phi)=\alpha } erfüllt ist. Des Weiteren ist die Gütefunktion monoton. Bei einem Vertauschen von Nullhypothese und Alternative kehren sich die kleinergleich/größergleich-Zeichen um.
Eine große Verteilungsklasse mit monotonem Dichtequotient ist die einparametrische Exponentialfamilie (wenn die Parameterfunktion Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \eta } monoton ist oder die Familie in natürlicher Parametrisierung vorliegt).
Das Ergebnis über beste einseitige Tests leitet sich direkt aus dem Neyman-Pearson-Lemma ab: Aufgrund der Monotonie des Dichtequotienten ist der Test von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \vartheta_0 } gegen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \vartheta } für alle Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \vartheta \in \Theta_1 } ein gleichmäßig bester Test, somit ist ein gleichmäßig bester Test von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \vartheta } gegen . Da man zeigen kann, dass die Gütefunktion monoton ist, hält der Test für alle Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \vartheta \in \Theta_0 } das Niveau Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \alpha } ein und ist somit ein gleichmäßig bester Test zum Niveau Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \alpha } von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Theta_0 } gegen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Theta_1 } .
Weitere Aussagen
Weitere Existenzaussagen erhält man beispielsweise durch die Einschränkung auf kleinere Klassen von Tests wie unverfälschte Tests, für diese lassen sich Aussagen beispielsweise mithilfe von ähnlichen Tests herleiten.
Verwandte Begriffe
Der zum gleichmäßig besten Test duale Begriff für Konfidenzbereiche (im Sinne der Dualität von Tests und Konfidenzbereichen) ist der gleichmäßig bester Konfidenzbereich.
Weblinks
- M.S. Nikulin: Uniformly most-powerful test. In: Michiel Hazewinkel (Hrsg.): Encyclopedia of Mathematics. Springer-Verlag und EMS Press, Berlin 2002, ISBN 978-1-55608-010-4 (englisch, online).
Literatur
- Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, doi:10.1515/9783110215274.
- Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, doi:10.1007/978-3-642-41997-3.