Alphafehler-Kumulierung

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Alphainflation)

Die Alphafehler-Kumulierung, häufig auch α-Fehler-Inflation genannt, bezeichnet in der Statistik die globale Erhöhung der Alpha-Fehler-Wahrscheinlichkeit (Fehler 1. Art) durch multiples Testen in derselben Stichprobe.

Anschaulich formuliert: Je mehr Hypothesen man auf einem Datensatz testet, desto höher wird die Wahrscheinlichkeit, dass eine davon (fehlerhaft) als zutreffend angenommen wird.

Mehrfaches Testen

Oft wird in einer Studie nicht nur eine Nullhypothese festgelegt, sondern man will mehrere Fragen mittels der gewonnenen Daten beantworten. Dies können weitere Nullhypothesen, aber auch Konfidenzintervalle oder Schätzwerte sein.

Im Falle von mehreren Nullhypothesen spricht man dann von einem multiplen Testproblem.

In solchen Fällen stößt man auf die folgenden zwei Probleme:

1) Inkonsistenzen (Bsp.)

Angenommen jemand will die Erwartungswerte vergleichen. Beim paarweisen Test werden alle Nullhypothesen nicht abgelehnt, nur die Hypothese wird abgelehnt.

2) Inflation des α-Fehlers

Bei multiplen Testproblemen werden das lokale (nur die einzelne Hypothese betreffende) α-Niveau und das globale α-Niveau (für die gesamte Hypothesenfamilie) unterschieden. Falls die Tests unabhängig sind, kann für jede Nullhypothese das lokale α auf der Basis des globalen Niveaus nach folgender Formel angepasst werden: mit k= Anzahl der Einzelhypothesen.

Adjustierung des globalen α-Niveaus

Wie aber kann man dieser α-Fehler-Inflation entgegenwirken bzw. sie korrigieren?

Bonferroni-Korrektur

Die Bonferroni-Korrektur[1] ist die einfachste und konservativste Form, das multiple α-Niveau anzupassen. Dabei wird das globale α-Niveau zu gleichen Teilen auf die Einzeltests verteilt:

Daraus folgt mittels der Bonferroni-Ungleichung, dass jeder Einzeltest unter dem Niveau (und nicht ) durchgeführt wird: Für gilt

Die sehr konservative Vorgehensweise bei der Bonferroni-Korrektur hat den Nachteil, dass das Ergebnis einen sehr geringen p-Wert aufweisen muss, um als statistisch signifikant gelten zu können. Dies versuchen Weiterentwicklungen wie die Bonferroni-Holm-Prozedur zu vermeiden.

Bonferroni-Holm-Prozedur

Eine Erweiterung der Bonferroni-Korrektur stellt die Bonferroni-Holm-Prozedur[2] dar. Dabei kommt folgender Algorithmus zum Tragen:

1. Schritt:

Festlegung des globalen α-Niveaus

2. Schritt:

Durchführung aller Einzeltests und Ermittlung der p-Werte

3. Schritt:

Sortieren der p-Werte vom Kleinsten zum Größten

4. Schritt:

Berechnung der lokalen α-Niveaus als Verhältnis von globalem α-Niveau zur Anzahl der Tests - i, wobei gilt:

5. Schritt

Vergleiche die p-Werte mit den berechneten sortierten lokalen α-Niveaus (beginnend mit ) und wiederhole diesen Schritt so oft, bis der p-Wert größer ist als der zugehörige Wert.

6. Schritt

Alle Nullhypothesen, deren p kleiner als der lokale α-Wert waren, werden zurückgewiesen (bedeutet: der Effekt ist signifikant, es wird davon ausgegangen, dass die Alternativhypothese zutrifft). Die Prozedur endet mit derjenigen Nullhypothese, deren p größer als das lokale α-Niveau ist. Alle folgenden Nullhypothesen werden nicht zurückgewiesen (unter dem globalen α-Niveau).

Die Bonferroni-Holm-Prozedur ist weniger konservativ als die Bonferroni-Korrektur. Nur der erste Test muss auf dem bei der Bonferroni-Korrektur erforderlichen Niveau statistisch signifikant sein, danach sinkt das nötige Niveau stetig. Allerdings weist auch diese Prozedur ebenso wie die Bonferroni-Korrektur den Nachteil auf, dass eventuelle logische und stochastische Abhängigkeiten zwischen den Teststatistiken nicht genutzt werden.

Weitere Methoden

Neben den beschriebenen Adjustierungen existieren noch weitere Möglichkeiten der Anpassung an ein globales α-Niveau. Dazu gehören beispielsweise:

Belege

  1. A. Victor, A. Elsässer, G. Hommel, M. Blettner: Wie bewertet man die p-Wert-Flut? In: Dtsch Arztebl Int. 107(4), 2010, S. 50–56 doi:10.3238/arztebl.2010.0050.
  2. S. Holm: A simple sequentially rejective multiple test procedure. In: Scandinavian Journal of Statistics. Vol. 6, 1979, S. 65–70.