Verallgemeinerte inverse Verteilungsfunktion
Die (verallgemeinerte) inverse Verteilungsfunktion,[1] auch Quantil-Transformation[2] oder Quantil-Funktion[3] oder percent point function genannt, ist eine spezielle reelle Funktion in der Stochastik, einem Teilgebiet der Mathematik. Jeder Verteilungsfunktion kann eine verallgemeinerte inverse Verteilungsfunktion zugeordnet werden, die unter gewissen Bedingungen die inverse Funktion der Verteilungsfunktion ist. Die verallgemeinerte inverse Verteilungsfunktion ordnet jeder Zahl zwischen null und eins den kleinsten Wert zu, an dem die Verteilungsfunktion diese Zahl überschreitet.
Beschreibt beispielsweise eine Wahrscheinlichkeitsverteilung die Schuhgrößen der Europäer und ist die entsprechende Verteilungsfunktion gegeben, so gibt die zugehörige verallgemeinerte inverse Verteilungsfunktion an der Stelle diejenige kleinste Schuhgröße an, so dass mehr als 90 % der Europäer eine Schuhgröße kleiner als tragen.
Die verallgemeinerte inverse Verteilungsfunktion wird unter anderem zur Bestimmung von Quantilen herangezogen. Ebenso liefert sie einen Ansatz zur Konstruktion von Zufallsvariablen mit vorgegebenen Verteilungen. Derselben zugrunde liegenden Idee folgend dient sie bei der Inversionsmethode zur Erzeugung von Zufallszahlen mit vorgegebener Verteilung aus Standardzufallszahlen.
Definition
Sei eine -Zufallsvariable und
seine Verteilungsfunktion. Das heißt für gilt
- ist monoton wachsend und rechtsseitig stetig.
- Für das Grenzwertverhalten gilt und .
-Quantil:
Jedes mit
heißt -Quantil.
Linke verallgemeinerte inverse Verteilungsfunktion:
Die Funktion
definiert durch
heißt die linke verallgemeinerte inverse Verteilungsfunktion von .[1] Allgemein bezeichnet man diese auch einfach als verallgemeinerte inverse Verteilungsfunktion.
Rechte verallgemeinerte inverse Verteilungsfunktion:
Die Funktion
definiert durch
heißt die rechte verallgemeinerte inverse Verteilungsfunktion von .
Ist streng monoton steigend, dann gilt
Bemerkungen zur Definition
Zu beachten ist, dass die Verteilungsfunktion, zu der die verallgemeinerte inverse Verteilungsfunktion definiert wird, nicht notwendigerweise zu einer Wahrscheinlichkeitsverteilung gehören muss. Sie muss lediglich die vier oben genannten Eigenschaften (Monotonie, Rechtsstetigkeit und die zwei Grenzwerteigenschaften) erfüllen. Dies beruht darauf, dass die verallgemeinerte inverse Verteilungsfunktion zur Konstruktion von Wahrscheinlichkeitsverteilungen mit Verteilungsfunktion verwendet wird. Die Existenz solch einer Wahrscheinlichkeitsverteilung in der Definition zu fordern wäre damit zirkulär.
Die Notation der verallgemeinerten inversen Verteilungsfunktion als ist suggestiv zu verstehen, da die Verteilungsfunktion nicht immer invertierbar sein muss. Dies tritt zum Beispiel dann auf, wenn sie auf einem Intervall konstant ist. Ist jedoch invertierbar, so stimmen die Inverse der Verteilungsfunktion und die verallgemeinerte inverse Verteilungsfunktion überein. Da die verallgemeinerte inverse Verteilungsfunktion im Gegensatz zur Inversen immer existiert rechtfertigt dies die Benennung als "verallgemeinert".
Erläuterung
Nach der Definition ist der Funktionswert der verallgemeinerten inversen Verteilungsfunktion an der Stelle die kleinste Zahl, an der die Verteilungsfunktion den Funktionswert überschreitet.
Ist die Verteilungsfunktion stetig, so erhält man diesen Wert anschaulich auf die folgende Art und Weise: Man zeichnet eine zur x-achse parallele Gerade, welche um den Wert nach oben verschoben ist. Diese schneidet die Verteilungsfunktion in einem Punkt oder einem Intervall. Schneidet sie die Verteilungsfunktion in einem Punkt Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (x,u) } , so ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x } der Funktionswert der verallgemeinerten inversen Verteilungsfunktion an der Stelle Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle u } . Schneidet die Gerade die Verteilungsfunktion in einem Intervall, so wählt man denjenigen Punkt aus dem Intervall aus, der die kleinste Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x} -Koordinate besitzt.
Beispiel
Betrachte als Beispiel die Verteilungsfunktion der Exponentialverteilung. Sie ist gegeben durch
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle F_X(x) = \begin{cases} 1-\mathrm{e}^{-\lambda x}& x\geq 0, \\ 0 & x < 0, \end{cases}}
wobei Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \lambda } ein echt positiver reeller Parameter ist. Sie ist auf Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (0, \infty) } streng monoton wachsend und bildet dieses Intervall bijektiv auf Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (0,1) } ab. Somit existiert eine eindeutige Umkehrfunktion Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle F_{X-}^{-1} } , welche sich durch Auflösen von
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle u = 1-\mathrm{e}^{-\lambda x} }
nach Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x } ergibt. Dies liefert die verallgemeinerte inverse Verteilungsfunktion
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle F_{X-}^{-1}(u)=\frac{-\ln(1-u)}{\lambda} } .
Im Allgemeinen ist es selten möglich, die verallgemeinerte inverse Verteilungsfunktion wie hier direkt zu berechnen. So sind die wenigsten Verteilungsfunktionen invertierbar, da sie häufig konstante Bereiche aufweisen. Beispiel hierfür sind die Verteilungsfunktionen von diskreten Verteilungen. Ebenso muss selbst bei Invertierbarkeit keine geschlossene Darstellung der Verteilungsfunktion existieren, auf die man zurückgreifen könnte. So muss die Verteilungsfunktion der Normalverteilung stets numerisch berechnet werden.
Eigenschaften
Die verallgemeinerte inverse Verteilungsfunktion ist monoton wachsend, linksseitig stetig und damit eine Zufallsvariable bzw. messbar von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle ((0,1), \mathcal B((0,1))) } nach Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (\R, \mathcal B(\R)) } . Versieht man den Messraum Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle ((0,1), \mathcal B((0,1))) } mit der stetigen Gleichverteilung Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal U_{(0,1)} } oder äquivalent dem Lebesgue-Maß, so gilt:
- Die Verteilung von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle F^{-1} } unter Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal U_{(0,1)} } ist das Wahrscheinlichkeitsmaß auf Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \R } , welches die Verteilungsfunktion Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle F } besitzt.
Jedes Wahrscheinlichkeitsmaß Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle P } auf Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \R } mit Verteilungsfunktion Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle F_P } kann damit als Verteilung der Zufallsvariable
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle F_P^{-1} \colon ((0,1), \mathcal B((0,1)), \mathcal U_{(0,1)}) \to (\R, \mathcal B(\R)) }
aufgefasst werden.
Verwendung
Konstruktion von Zufallsvariablen vorgegebener Verteilung
Zufallsvariablen werden als messbare Abbildungen zwischen Messräumen eingeführt. Ist auf dem Grundraum noch ein Wahrscheinlichkeitsmaß definiert, so kann ihre Verteilung definiert werden. Im Laufe der weiteren Abstraktion werden aber der Grundraum und zugehöriges Wahrscheinlichkeitsmaß immer unwichtiger im Gegensatz zur Verteilung der Zufallsvariable. Effektiv lässt sich zeigen, dass zu jeder Zufallsvariable mit einer vorgegebenen Verteilung ein passender Grundraum mit Wahrscheinlichkeitsmaß ergänzen lässt. Die verallgemeinerte inverse Verteilungsfunktion liefert für reelle Verteilungen solch ein Argument: Jede reellwertige Zufallsvariable mit vorgegebener Verteilung kann als Zufallsvariable auf dem Intervall von null bis eins, versehen mit der stetigen Gleichverteilung, aufgefasst werden.[4] Somit kann die Untersuchung von Zufallsvariablen und ihren Verteilungen von dem zugrunde liegenden Wahrscheinlichkeitsraum losgelöst werden.
Konstruktion stochastisch unabhängiger Zufallsvariablen
Die obige Konstruktion wird teils auch verwendet, um die Existenz reellwertiger unabhängiger Zufallsvariablen zu zeigen. Dabei wird zuerst über ein Approximationsargument die Existenz von stochastisch unabhängigen, auf dem Intervall Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (0,1) } unabhängigen Zufallsvariablen gezeigt. Die Verkettung dieser Zufallsvariablen mit vorgegebenen verallgemeinerten inversen Verteilungsfunktionen sind dann reellwertige Zufallsvariablen mit vorgegebener Verteilung und wieder stochastisch unabhängig.[5]
Bestimmung von Quantilen
Ist eine Wahrscheinlichkeitsverteilung Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle P } (oder eine Zufallsvariable Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X } mit Verteilung Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle P_X=P } ) gegeben, so liefert die zugehörige verallgemeinerte inverse Verteilungsfunktion Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle F^{-1} } , ausgewertet an der Stelle Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle u } , stets ein Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle u} -Quantil. Dies folgt direkt aus der Definition.
Literatur
Einzelnachweise
- ↑ a b Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. 2014, S. 113.
- ↑ Georgii: Stochastik. 2009, S. 23.
- ↑ Eric W. Weisstein: Quantile Function. In: MathWorld (englisch).
- ↑
- ↑ Georgii: Stochastik. 2009, S. 72–73.