Permutationstest

aus Wikipedia, der freien Enzyklopädie

Ein Permutationstest ist in der nichtparametrischen Statistik ein exakter Test, bei dem zufällige Stichprobenwiederholungen unter Annahme der Nullhypothese identischer Verteilungen gezogen werden, häufig mithilfe von Monte-Carlo-Simulationen. Basierend auf der daraus resultierenden Verteilung der Teststatistik wird bestimmt, wie wahrscheinlich die Teststatistik der Originaldaten unter der Nullhypothese ist.

Animation eines Permutationstests. Die 4 Stichproben in rot sind einer Normalverteilung entnommen und die 5 Stichproben in blau sind einer anderen Normalverteilung entnommen. Die Hypothese ist, dass die roten Stichproben einer Verteilung mit größerem Mittelwert entstammen; die Nullhypothese ist, dass beide Stichproben der gleichen Verteilung entstammen. Die originale Teststatistik ist in pink dargestellt, die Teststatistiken der Kombinationen werden in das Histogramm eingetragen. Der geschätzte p-Wert ist der Anteil der Kombinationen, der einen gleichen oder größeren Wert der Teststatistik liefert als die original vorliegende Teststatistik.

Mithilfe von Permutationstests kann beispielsweise untersucht werden, ob zwei Stichproben aus unterschiedlichen Verteilungen stammen (beispielsweise kann man die Differenz der Mittelwerte als Teststatistik auswerten). Die Nullhypothese ist, dass beide Stichproben der gleichen Verteilung entstammen (und die Differenz der Mittelwerte den Wert 0 annimmt). Gilt die Nullhypothese, dann können Datenpunkte von der einen Stichprobe in die andere getauscht werden (Permutation). Man erhält durch Permutieren Stichprobenwiederholungen und kann dann die entsprechende Teststatistik wiederholt berechnen und deren empirische Verteilung bestimmen. Aus dieser Verteilung leitet sich direkt der p-Wert der auf den beiden ursprünglichen Stichproben vorliegenden Teststatistik ab[1].

Die Zahl der nötigen Permutationen kann durch Stoppregeln bestimmt werden[2].

Ein Beispiel für einen Permutationstest zur Varianzanalyse ist PERMANOVA.

Begriffliche Abgrenzung

Randomisierte Tests (welche auf einer zufälligen Zuweisung des Testergebnisses beruhen) sind nicht zu verwechseln mit Permutationstests (welche auf zufälligen Stichprobenwiederholungen basieren)[3]. Historisch wurden Permutationstests gelegentlich als randomisierte Tests bezeichnet. Bootstrap-basierte Tests nehmen nicht die Nullhypothese an.

Literatur

  • Monte Carlo Methods. In: Randomization, Bootstrap and Monte Carlo Methods in Biology. Chapman and Hall/CRC, 3. Oktober 2018.

Einzelnachweise

  1. Permutation Test: Visual Explanation. Abgerufen am 21. September 2021.
  2. Axel Gandy: Sequential Implementation of Monte Carlo Tests With Uniformly Bounded Resampling Risk. In: Journal of the American Statistical Association. Band 104, Nr. 488, Dezember 2009, ISSN 0162-1459, S. 1504–1511, doi:10.1198/jasa.2009.tm08368.
  3. Patrick Onghena: Randomization Tests or Permutation Tests? A Historical and Terminological Clarification. In: Randomization, Masking, and Allocation Concealment. 1. Auflage. Chapman and Hall/CRC, Boca Raton 2017, ISBN 978-1-315-30511-0, S. 209–228, doi:10.1201/9781315305110-14 (taylorfrancis.com).