Verteilung einer Zufallsvariablen
Die Verteilung einer Zufallsvariablen ist ein Begriff aus der Wahrscheinlichkeitstheorie, einem Teilgebiet der Mathematik. Die Verteilung einer Zufallsvariablen ermöglicht es, aus einem „zu großen“ stochastischen Modell Informationen zu extrahieren und diesen wieder sinnvolle Wahrscheinlichkeiten zuzuordnen. Ein Beispiel hierfür ist eine Lotto-Ziehung: Bei der Modellierung werden zunächst die Wahrscheinlichkeiten für jede einzelne Zahlenkombination definiert. Man ist jedoch im Allgemeinen nicht an der Wahrscheinlichkeit interessiert, exakt eine bestimmte Zahlenfolge zu ziehen, sondern daran, wie groß die Wahrscheinlichkeit für „n Richtige“ ist. Man definiert dazu eine Zufallsvariable, welche die Informationen „Anzahl der Richtigen“ extrahiert. Die Verteilung dieser Zufallsvariablen gibt dann die Wahrscheinlichkeit an, dass man „n Richtige“ gezogen hat.
Definition
Gegeben sei eine Zufallsvariable , d. h. eine Abbildung vom Wahrscheinlichkeitsraum in den Ereignisraum . Dann heißt die durch
definierte Abbildung die Verteilung der Zufallsvariablen unter . Sie definiert ein Wahrscheinlichkeitsmaß auf . Hierbei bezeichnet das Urbild von unter , also das Ereignis . Manchmal wird für auch geschrieben.
Beispiele
Wir betrachten als Modell einen dreimaligen Münzwurf, modelliert durch den Wahrscheinlichkeitsraum mit Ergebnismenge
- ,
Ereignissystem
und als Wahrscheinlichkeitsmaß die Gleichverteilung, da die Münze als fair angenommen wird und die Würfe unabhängig voneinander stattfinden, also
- .
Der zweite Ereignisraum sei nun definiert als
- ,
die Zufallsvariable zählt die Erfolge, also
Um nun die Verteilung dieser Zufallsvariablen zu bestimmen, genügt es, einen Erzeuger, also hier die einzelnen Elementarereignisse durchzugehen. Alle anderen Wahrscheinlichkeiten ergeben sich dann durch Addition der Wahrscheinlichkeiten der (disjunkten) Erzeuger. Es ist dann
- .
Dies ist dann die Verteilung der Zufallsvariablen und ein neues Wahrscheinlichkeitsmaß auf dem Ereignisraum .
Maßtheoretischer Blickwinkel
Aus Sicht der Maßtheorie handelt es sich bei der Verteilung einer Zufallsvariablen um ein Bildmaß. Der Wahrscheinlichkeitsraum entspricht einem speziellen Maßraum, der Ereignisraum ist identisch mit einem Messraum und die Zufallsvariable ist eine messbare Funktion. Ebenso wie das Bildmaß ermöglicht die Verteilung einer Zufallsvariablen also das „Versetzen“ und Modifizieren eines Wahrscheinlichkeitsmaßes von einem Maßraum in einen Messraum.
Wahrscheinlichkeitsmaße als Verteilungen
Allgemeine Wahrscheinlichkeitsmaße als Verteilungen
Ist ein Wahrscheinlichkeitsraum gegeben, so lässt sich das Wahrscheinlichkeitsmaß auf folgende Weise als Verteilung einer Zufallsvariablen darstellen: Man dupliziert den Ereignisraum und wählt als Zufallsvariable die identische Abbildung von nach . Dann stimmen das Wahrscheinlichkeitsmaß und die Verteilung der Zufallsvariablen überein. Dies rechtfertigt unter anderem auch die gängige Bezeichnung „Wahrscheinlichkeitsverteilung“ für Wahrscheinlichkeitsmaße.
Reelle Wahrscheinlichkeitsmaße als Verteilungen auf einem gemeinsamen Wahrscheinlichkeitsraum
Tatsächlich lässt sich jedes Wahrscheinlichkeitsmaß auf dem Ereignisraum als Verteilung einer Zufallsvariablen auf dem Wahrscheinlichkeitsraum darstellen. Hierbei bezeichnet die stetige Gleichverteilung auf dem Intervall von 0 bis 1. Dazu nutzt man aus, dass jedes Wahrscheinlichkeitsmaß durch seine Verteilungsfunktion eindeutig definiert ist. Ist nun Verteilungsfunktion von , so wählt man als Zufallsvariable die Quantilfunktion definiert durch
- ,
wobei ist. Diese Zufallsvariable hat nun das Wahrscheinlichkeitsmaß als Verteilung. Diese Aussage ermöglicht es beispielsweise, beliebige Zufallsvariable in die reellen Zahlen auf stochastische Unabhängigkeit zu untersuchen, da sie immer als Zufallsvariable auf demselben Wahrscheinlichkeitsraum aufgefasst werden können.
Als Verteilungen konstruierte Wahrscheinlichkeitsmaße
Binomial-Verteilung
Die Binomialverteilung lässt sich elementar als Verteilung einer Zufallsvariablen definieren. Dazu definiert man den einfachen Münzwurf einer unfairen Münze mit dem Wahrscheinlichkeitsraum , der Anzahl der Erfolge, der Ereignismenge und dem Wahrscheinlichkeitsmaß . Das n-malige unabhängige Werfen der Münze wird dann durch das Produktmodell beschrieben. Definiert man nun eine Zufallsvariable von dem Produktmodell nach durch
- ,
so modelliert diese Zufallsvariable die Anzahl der Erfolge bei Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle n} Münzwürfen. Die Verteilung der Zufallsvariablen ist dann die Binomialverteilung, also Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X \sim \mathrm{Bin}_{n,p} } .
Geometrische Verteilung und negative Binomialverteilung
Ebenso wie die Binomialverteilung lassen sich die geometrische Verteilung und die negative Binomialverteilung aus einem Produktmodell eines Münzwurfes als Verteilung einer Zufallsvariablen herleiten. Das Produktmodell ist in diesem Fall der unendlich oft wiederholte Münzwurf, also mit denselben Bezeichnungen wie oben Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (\Omega^{\otimes \N},\mathcal A^{\otimes \N} , P^{\otimes \N}) } . Die Zufallsvariable vom Produktmodell in den Ereignisraum Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (\N, \mathcal P (\N)) } definiert durch
modelliert dann die Wartezeit bis zum ersten Erfolg und hat als Verteilung die geometrische Verteilung. Modelliert man die Wartezeit auf den n-ten Erfolg, so erhält man die negative Binomialverteilung.
Verallgemeinerungen
Es existieren mehrere Spezialfälle der Verteilung einer Zufallsvariablen. Die gemeinsame Verteilung von Zufallsvariablen verwendet mehrere Zufallsvariablen, um eine multivariate Verteilung auf einem höherdimensionalen Raum zu definieren. Die Randverteilung hingegen ist die Verteilung einer Multivariaten Verteilung unter einer Koordinatenabbildung, sie reduziert somit die Dimensionalität der Wahrscheinlichkeitsverteilung.
Eine Variation der Verteilung einer Zufallsvariable ist die bedingte Verteilung und die reguläre bedingte Verteilung. Beide modellieren noch zusätzliches Vorwissen über den Ausgang des Zufallsexperimentes. Die bedingte Verteilung ist leichter zu handhaben und wird über die bedingte Wahrscheinlichkeit definiert, besitzt aber Defizite im Umgang mit Nullmengen und ist nicht so allgemein. Die reguläre bedingte Verteilung benötigt den technischen Begriff des bedingten Erwartungswertes.
Literatur
- Achim Klenke: Wahrscheinlichkeitstheorie. 3. Auflage. Springer-Verlag, Berlin Heidelberg 2013, ISBN 978-3-642-36017-6, doi:10.1007/978-3-642-36018-3.
- Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik. Für Studium, Berufspraxis und Lehramt. 8. Auflage. Vieweg, Wiesbaden 2005, ISBN 3-8348-0063-5, doi:10.1007/978-3-663-09885-0.
- Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, doi:10.1515/9783110215274.
- Christian Hesse: Angewandte Wahrscheinlichkeitstheorie. 1. Auflage. Vieweg, Wiesbaden 2003, ISBN 3-528-03183-2, doi:10.1007/978-3-663-01244-3.