Friedman-Test (Statistik)

aus Wikipedia, der freien Enzyklopädie

Der Friedman-Test ist ein statistischer Test zur Untersuchung von drei oder mehr gepaarten Stichproben auf Gleichheit des Lageparameters. Da er keine Normalverteilung der Daten in den Stichproben voraussetzt, zählt er zu den nichtparametrischen Verfahren. Er ist eine Erweiterung des Vorzeichentests auf die Anwendung für mehr als zwei Stichproben und eine parameterfreie Alternative zur Varianzanalyse mit wiederholten Messungen. Benannt wurde der Test nach dem amerikanischen Wirtschaftswissenschaftler Milton Friedman, der ihn entwickelt hat und 1937 in der Fachzeitschrift Journal of the American Statistical Association veröffentlichte. Eine Erweiterung des Friedman-Tests für die Anwendung auf Datensätze mit fehlenden Werten ist der Durbin-Skillings-Mack-Test.

Testbeschreibung

Der Friedman-Test setzt voraus, dass die Werte zwischen den Stichproben gepaart und innerhalb der Stichproben unabhängig voneinander sind. Die Analyse beruht auf einer Sortierung der Werte in jedem gepaarten Satz von Daten vom kleinsten zum größten Wert, wobei jeder Wertesatz separat sortiert wird. Anschließend werden die Ränge in jeder Stichprobe addiert. Der p-Wert als Maß für die statistische Signifikanz ist dabei umso geringer, je größer die Unterschiede zwischen den Rangsummen der einzelnen Stichproben sind.

Unter der Voraussetzung, dass die untersuchten Stichproben eine vergleichbare Häufigkeitsverteilung aufweisen, ist die Nullhypothese des Tests die Annahme, dass zwischen den Stichproben kein Unterschied in der Lage besteht. Ein p-Wert kleiner 0,05 wird deshalb im Allgemeinen so interpretiert, dass sich der Medianwert mindestens einer der untersuchten Stichproben signifikant von dem der anderen Stichproben unterscheidet. Erhebliche Unterschiede hinsichtlich der Verteilung können jedoch bei vergleichbarer Lage ebenfalls zu einem signifikanten p-Wert führen.

Alternative Verfahren

Der Friedman-Test ist eine parameterfreie Alternative zur parametrischen Varianzanalyse mit wiederholten Messungen, falls deren Voraussetzungen nicht erfüllt sind. Statt des Friedman-Tests kann auch der ebenfalls nichtparametrische Quade-Test verwendet werden. Dieser weist in der Regel für den Vergleich von bis zu fünf Stichproben eine höhere Teststärke auf, während der Friedman-Test für mehr als fünf Stichproben in den meisten Fällen als teststärker gilt. Der Quade-Test ist dem Friedman-Test außerdem deutlich überlegen bei Daten mit unterschiedlichen Spannweiten in den einzelnen Stichproben, da beim Quade-Test anders als beim Friedman-Test die Spannweite zur Gewichtung der Einzelränge genutzt wird. Andererseits ist die Anwendung des Friedman-Tests im Gegensatz zum Quade-Test auch bei ordinalskalierten Daten möglich, die beispielsweise als Rangdaten erhoben wurden oder auf der Rangtransformation von kardinalskalierten Messwerten beruhen, und für die demzufolge keine Spannweiten ermittelt werden können.

Der ebenfalls nichtparametrische Kruskal-Wallis-Test, der wie der Friedman-Test zur Varianzanalyse von drei oder mehr Stichproben verwendet wird, dient im Gegensatz zu diesem zum Vergleich von ungepaarten Daten. Ein parameterfreier Test zum Vergleich von zwei gepaarten Stichproben ist der Wilcoxon-Vorzeichen-Rang-Test. Dessen Anwendung für multiple Zwei-Gruppen-Vergleiche zwischen mehreren Stichproben ist jedoch entweder auf wenige im Voraus geplante Vergleiche zu beschränken oder durch eine Korrektur der Alphafehler-Kumulierung zu ergänzen, die beispielsweise mit der Bonferroni-Methode durchgeführt werden kann.

Der von John Skillings und Gregory Mack entwickelte Skillings-Mack-Test, aufgrund von vorherigen Untersuchungen von James Durbin auch als Durbin-Skillings-Mack-Test bezeichnet, ist eine Verallgemeinerung des Friedman-Tests auf Datensätze mit fehlenden Werten. Bei vollständigen Datensätzen ist er äquivalent zum Friedman-Test.

Literatur

  • Milton Friedman: The Use of Ranks to Avoid the Assumption of Normality Implicit in the Analysis of Variance. In: Journal of the American Statistical Association. 32(200)/1937, S. 675–701, doi:10.1080/01621459.1937.10503522 JSTOR 2279372; Korrektur in: A Correction: The Use of Ranks to Avoid the Assumption of Normality Implicit in the Analysis of Variance. 34(205)/1939, S. 109, doi:10.1080/01621459.1939.10502372.
  • The Friedman Two-Way Analysis of Variance by Ranks. In: David Sheskin: Handbook of Parametric and Nonparametric Statistical Procedures. Vierte Auflage. CRC Press, Boca Raton 2007, ISBN 1-58-488814-8, S. 1075–1088.
  • James Durbin: Incomplete Blocks in Ranking Experiments. In: British Journal of Psychology. 4/1951, S. 85–90, doi:10.1111/j.2044-8317.1951.tb00310.x.
  • John H. Skillings, Gregory A. Mack: On the Use of a Friedman-Type Statistic in Balanced and Unbalanced Block Designs. In: Technometrics. 23(2)/1981, S. 171–177, doi:10.1080/00401706.1981.10486261 JSTOR 1268034.
  • Knut M. Wittkowski: Friedman-Type Statistics and Consistent Multiple Comparisons for Unbalanced Designs with Missing Data. In: Journal of the American Statistical Association Vol. 83, No. 404 (Dec., 1988), S. 1163–1170, doi:10.2307/2290150.