Dispersionsmaß (Stochastik)

aus Wikipedia, der freien Enzyklopädie
Dichtefunktionen zweier normalverteilter Zufallsvariablen und mit gleichem Erwartungswert aber unterschiedlichen Varianzen. Die Varianz stellt das bekannteste Dispersionsmaß dar.

Ein Dispersionsmaß[1], auch Streuungsmaß[2] oder Streuungsparameter[3] genannt, ist in der Stochastik eine Kennzahl der Verteilung einer Zufallsvariable beziehungsweise eines Wahrscheinlichkeitsmaßes. Anschaulich ist es die Aufgabe eines Dispersionsmaßes, ein Maß für die Streuung der Zufallsvariable um einen „typischen“ Wert anzugeben. Dabei wird der typische Wert durch ein Lagemaß angegeben.

Der Begriff des Dispersionsmaßes wird in der Literatur nicht immer eindeutig verwendet. So spricht man auch in der Statistik von Dispersionsmaßen von Stichproben. Eine genaue Abgrenzung erfolgt im unten stehenden Abschnitt.

Typische Dispersionsmaße

Um den Erwartungswert

Häufig werden Dispersionsmaße um den Erwartungswert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname E (X) } angegeben, sie beruhen meist auf den Momenten zweiter Ordnung, selten auch auf denen erster oder höherer Ordnung. Bekannteste Beispiele sind:

  • Die Varianz als zentriertes zweites Moment:
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma_X = \sqrt{\operatorname{Var}(X)}.}
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{VarK}(X) = \frac{\sqrt{\operatorname{Var}(X)}}{\operatorname{E}(X)} }

Dies sind alles Dispersionsmaße, die auf das zweite Moment zurückgreifen. Eines, das nur auf das erste Moment zurückgreift ist der mittlere absolute Abstand:

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{mad}(X) = \operatorname E (|X- \operatorname E (X)|) } .

Der mittlere absolute Abstand ist also das absolute zentrierte erste Moment.

Um den Median

Dispersionsmaße um den Median werden meist über die Quantilfunktion Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle Q } definiert, da der Median auch ein Quantil ist (das 0,5-Quantil). Gängig ist der Interquartilabstand

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \delta_Q:= Q(0{,}75)-Q(0{,}25) }

Dieser entspricht naiv der Breite des Intervalls, in dem sich die „mittleren 50 % der Wahrscheinlichkeit“ befinden. Der Interquartilabstand lässt sich verallgemeinern, indem man für beliebiges Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p \in (0; 0{,}5) } die Differenz von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle Q(1-p) } und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle Q(p) } bildet. Dies liefert die Breite des Intervalls, in dem sich die mittleren 200p % der Wahrscheinlichkeit befinden. Dieses Dispersionsmaß wird Interquantilsabstand genannt.

Mehrdeutigkeiten des Begriffes

An zwei Stellen ist die Verwendung des Begriffs des Dispersionsmaßes zweideutig:

  1. Bei Verwendung von Verteilungsklassen, die durch ein oder mehrere (reelle) Parameter näher bestimmt werden können
  2. Im Übergang zur deskriptiven Statistik, in der Stichproben Kennzahlen zugeordnet werden sollen, im Gegensatz zu Wahrscheinlichkeitsmaßen

Beispiel für den ersten Fall ist die Normalverteilung: Sie wird durch zwei Parameter Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu, \sigma^2 } bestimmt. Dabei bestimmt der Parameter Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2 } die Varianz und wird dementsprechend auch der Streuparameter genannt. Allerdings existiert nicht zu jeder Verteilung ein Parameter, der die Streuung bestimmt. Selbst wenn solch ein Formparameter für die „Breite“ der Verteilung existiert, muss er nicht mit dem gewählten Dispersionsmaß zusammenfallen.

Im zweiten Fall sind Dispersionsmaße Kennzahlen einer Stichprobe, wohingegen die hier besprochenen Dispersionsmaße Kennzahlen von Wahrscheinlichkeitsmaßen, also (Mengen)funktionen sind. So wäre ein Dispersionsmaß in der despriptiven Statistik beispielsweise die Spannweite. Sie ist die Differenz des größten und des kleinsten Messwertes in der Stichprobe. Dieses Konzept kann nicht ohne Weiteres auf Wahrscheinlichkeitsmaße übertragen werden. Zusätzlich verwirrend ist oft, dass dieselbe Bezeichnung für Kennzahlen von Stichproben und von Wahrscheinlichkeitsverteilungen verwendet werden (Interquartilabstand, Standardabweichung etc.)

Beziehung zu den Kennzahlen der deskriptiven Statistik

Die Beziehung zwischen den Kennzahlen einer Stichprobe und denen eines Wahrscheinlichkeitsmaßes wird durch die empirische Verteilung hergestellt. Ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x=(x_1,x_2, \dots, x_n ) } eine Stichprobe, so gilt:

  • Die Varianz der empirischen Verteilung zu ist die unkorrigierte Stichprobenvarianz von der Stichprobe Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x }
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \tilde s^2= \frac 1n \sum_{i=1}^n (x_i - \bar{x})^2 }
  • ebenso ist die Standardabweichung und der Variationskoeffizient der empirischen Verteilung die empirische Standardabweichung und der empirische Variationskoeffizient von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x } .
  • Da sich auch die Quantile entsprechend übertragen ist der Interquartilsabstand (Interquantilsabstand) der empirischen Verteilung der Interquartilsabstand (Interquantilsabstand) der Stichprobe.

Weblinks

Literatur

  • Christian Hesse: Angewandte Wahrscheinlichkeitstheorie. 1. Auflage. Vieweg, Wiesbaden 2003, ISBN 3-528-03183-2, doi:10.1007/978-3-663-01244-3.
  • Norbert Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. Eine Einführung. 2., überarbeitete und erweiterte Auflage. Springer-Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-45386-1, doi:10.1007/978-3-642-45387-8.
  • Klaus D. Schmidt: Maß und Wahrscheinlichkeit. 2., durchgesehene Auflage. Springer-Verlag, Heidelberg Dordrecht London New York 2011, ISBN 978-3-642-21025-9, doi:10.1007/978-3-642-21026-6.

Einzelnachweise

  1. Hesse: Angewandte Wahrscheinlichkeitstheorie. 2003, S. 153.
  2. Schmidt: Maß und Wahrscheinlichkeit. 2011, S. 286.
  3. Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. 2014, S. 241.