Empirisches Quantil
Ein empirisches (-)Quantil, auch Stichprobenquantil oder kurz Quantil genannt, ist in der Statistik eine Kennzahl einer Stichprobe. Für jede Zahl zwischen 0 und 1 teilt – vereinfacht dargestellt – ein empirisches -Quantil die Stichprobe so, dass ein Anteil der Stichprobe von kleiner als das empirische -Quantil ist und ein Anteil von der Stichprobe größer als das empirische -Quantil ist. Ist beispielsweise eine Stichprobe von Schuhgrößen gegeben, so ist das empirische 0,35-Quantil diejenige Schuhgröße , so dass 35 % der Schuhgrößen in der Stichprobe kleiner als sind und 65 % größer als sind.
Einige empirische Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p} -Quantile tragen Eigennamen. Zu ihnen gehören der Median (Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p=0{,}5 } ), das obere Quartil und das untere Quartil sowie die Terzile, Quintile, Dezile und die Perzentile.
Von den hier besprochenen empirischen Quantilen sind die Quantile (im Sinne der Wahrscheinlichkeitstheorie) zu unterscheiden. Diese sind Kennzahlen einer Wahrscheinlichkeitsverteilung und damit einer abstrakten (Mengen-)Funktion (ähnlich dem Erwartungswert), während die empirischen Quantile Kennzahlen einer Stichprobe sind (ähnlich dem arithmetischen Mittel).
Definition
Es bezeichne die Abrundungsfunktion. Sie rundet jede Zahl Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x} auf die nächste kleinere ganze Zahl ab. Es gilt also beispielsweise Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \lfloor 1{,}2 \rfloor=1 } und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \lfloor 3{,}99 \rfloor =3 } .
Gegeben sei eine Stichprobe Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \left(x_1, x_2,\dotsc, x_n\right)} der Größe Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle n } , deren Elemente der Größe nach geordnet sind. Dies bedeutet, es gilt
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_1 \leq x_2 \leq \dotsb \leq x_n } .
Dann heißt für eine Zahl Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p \in (0,1) }
das empirische Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p} -Quantil von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_1, x_2,\dotsc, x_n } .[1]
Es existieren einige von der hier angegebenen Definition abweichende Definitionen.[2]
Beispiel
Die folgende Stichprobe besteht aus zehn zufälligen ganzen Zahlen (gezogen aus den Zahlen zwischen null und hundert, versehen mit der diskreten Gleichverteilung):
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 82; 91; 12; 92; 63; 9; 28; 55; 96; 97 }
Sortieren liefert die Stichprobe
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_1=9; x_2=12; x_3=28; x_4=55; x_5=63; x_6=82; x_7=91; x_8=92; x_9=96; x_{10}=97 } .
Es ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle n=10 } .
Für Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p=0{,}5 } erhält man Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p \cdot n = 5 } . Da dies ganzzahlig ist, erhält man über die Definition
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_{0{,}5}= \tfrac 12 \left( x_5+x_{5+1}\right)= \tfrac 12 (63+82)= 72{,}5}
Für Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p=0{,}25 } erhält man Fehler beim Parsen (Konvertierungsfehler. Der Server („https://wikimedia.org/api/rest_“) hat berichtet: „Cannot get mml. Server problem.“): {\displaystyle p\cdot n+1=0{,}25\cdot 10+1=2{,}5+1} . Die Abrundungsfunktion liefert dann und damit
- Fehler beim Parsen (Konvertierungsfehler. Der Server („https://wikimedia.org/api/rest_“) hat berichtet: „Cannot get mml. Server problem.“): {\displaystyle x_{0{,}25}=x_{3}=28} .
Analog erhält man für Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p=0{,}75 } direkt Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p \cdot n +1=0{,}75 \cdot 10+1= 8{,}5} und damit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \lfloor 8{,} 5 \rfloor = 8 } , also ist
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_{0{,}75}=x_8=92 } .
Das empirische Quantil ist im Gegensatz zum arithmetischen Mittel robust gegenüber Ausreißern. Dies bedeutet, dass wenn man Werte einer Stichprobe oberhalb (oder unterhalb) eines bestimmten Quantils durch einen Wert oberhalb (oder unterhalb) des Quantils ersetzt, sich das Quantil selbst nicht verändert. Dies beruht darauf, dass Quantile nur durch ihre Ordnung und damit ihre Lage zueinander bestimmt werden und nicht durch die konkreten Zahlenwerte der Stichprobe. So wäre im Fall der obigen Stichprobe das arithmetische Mittel Fehler beim Parsen (Konvertierungsfehler. Der Server („https://wikimedia.org/api/rest_“) hat berichtet: „Cannot get mml. Server problem.“): {\displaystyle {\overline {x}}=62{,}5} . Modifiziert man nun aber den größten Wert der Stichprobe, setzt beispielsweise
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_{10}=1000 } ,
so ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \overline x = 152{,}8 } , wohingegen der Median sowie das untere und das obere Quartil unverändert bleiben, da sich die Reihenfolge der Stichprobe nicht verändert hat.
Spezielle Quantile
Für gewisse Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p} -Werte tragen die zugehörigen Quantile Eigennamen. Sie sind hier im Folgenden kurz vorgestellt. Zu beachten ist, dass auch die entsprechenden Quantile von Wahrscheinlichkeitsverteilungen teils mit denselben Eigennamen bezeichnet werden.
Median
Der Median ist das Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 0{,}5} -Quantil und teilt somit die Stichprobe in zwei Hälften: Eine Hälfte ist kleiner als der Median, die andere größer als der Median. Er ist mit dem Modus und dem arithmetischen Mittel ein wichtiger Lageparameter in der deskriptiven Statistik.
Terzil
Als Terzile werden die beiden Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p} -Quantile für Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p= \tfrac 13 } und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p = \tfrac 23 } bezeichnet. Sie teilen die Stichprobe in drei gleich große Teile: ein Teil ist kleiner als das untere Terzil (=-Quantil), ein Teil ist größer als das obere Terzil (=-Quantil), und ein Teil liegt zwischen den Terzilen.
Quartil
Als Quartile werden die beiden Quantile mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p=0{,}25 } und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p= 0{,}75 } bezeichnet. Dabei heißt das Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 0{,}25 } -Quantil das untere Quartil und das Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 0{,}75 } -Quantil das obere Quartil. Zwischen oberem und unterem Quartil liegt die Hälfte der Stichprobe, unterhalb des unteren Quartils und oberhalb des oberen Quartils jeweils ein Viertel der Stichprobe. Auf Basis der Quartile wird der Interquartilsabstand definiert, ein Streuungsmaß.
Quintil
Als Quintile werden die vier Quantile mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p= 0{,}2; 0{,}4; 0{,}6; 0{,}8 } bezeichnet. Demnach befinden sich 20 % der Stichprobe unter dem ersten Quintil und 80 % darüber, 40 % der Stichprobe unter dem zweiten Quintil und 60 % darüber etc.
Dezil
Die Quantile für Vielfache von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 0{,}1 } , also für Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p= 0{,}1; 0{,}2; \dotsc; 0{,}9 } werden Dezile genannt. Dabei heißt das Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 0{,}1 } -Quantil das erste Dezil, das Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 0{,}2 } -Quantil das zweite Dezil etc. Unterhalb des ersten Dezils liegen 10 % der Stichprobe, oberhalb entsprechend 90 % der Stichprobe. Ebenso liegen 40 % der Stichprobe unterhalb des vierten Dezils und 60 % oberhalb.
Perzentil
Als Perzentile werden die Quantile von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 0{,}01 } bis Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 0{,}99 } in Schritten von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 0{,}01 } bezeichnet.
Abgeleitete Begriffe
Aus den Quantilen lassen sich noch gewisse Streuungsmaße ableiten. Das wichtigste ist der Interquartilabstand (englisch interquartile range)
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \text{IQR} := x_{0{,}75} - x_{0{,}25} } .
Er gibt an, wie weit das obere und das untere Quartil auseinanderliegen und damit auch, wie breit der Bereich ist, in dem die mittleren 50 % der Stichprobe liegen.[3] Etwas allgemeiner kann der (Inter-)quantilabstand definiert werden als Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_{1-p} - x_{p} } für Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p \in (0; 0{,}5) } . Er gibt an, wie breit der Bereich ist, in dem die mittleren Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 200 \cdot p \, \% } der Stichprobe liegen. Für Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p= 0{,}25 } entspricht er dem Interquartilabstand.
Ein weiteres abgeleitetes Streumaß ist die mittlere absolute Abweichung vom Median.
Darstellung
Eine Möglichkeit, Quantile darzustellen, ist der Box-Plot. Dabei wird die gesamte Stichprobe durch einen Kasten – versehen mit zwei Antennen – dargestellt. Die äußere Begrenzung des Kastens sind jeweils das obere und das untere Quartil. Somit befindet sich die Hälfte der Stichprobe im Kasten. Der Kasten selbst ist nochmals unterteilt, der unterteilende Strich ist dabei der Median der Stichprobe. Die Antennen sind nicht einheitlich definiert. Eine Möglichkeit ist, als Begrenzung der Antennen das erste und das neunte Dezil zu wählen.
Einzelnachweise
- ↑ Norbert Henze: Stochastik für Einsteiger. Eine Einführung in die faszinierende Welt des Zufalls. 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, S. 30, doi:10.1007/978-3-658-03077-3.
- ↑ Eric W. Weisstein: Quantile. In: MathWorld (englisch).
- ↑ Eric W. Weisstein: Interquartile Range. In: MathWorld (englisch).