Vergleich der Poisson-Verteilung (schwarze Linien) und der
Binomialverteilung mit
![{\displaystyle n=10}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fecadd7726f4d4c6c390c2f2e73533d7a3729ab0)
(rote Kreise),
![{\displaystyle n=20}](https://wikimedia.org/api/rest_v1/media/math/render/svg/38e358eab6224f43dd62743f34df21d5bcf4a0f6)
(blaue Kreise),
![{\displaystyle n=1000}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6e0b9c34f11ec23948c922d73f07023832807388)
(grüne Kreise). Alle Verteilungen haben einen
Erwartungswert von 5. Die horizontale Achse zeigt die Anzahl der eingetretenen Ereignisse
![{\displaystyle k}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c3c9a2c7b599b37105512c5d570edc034056dd40)
. Je größer
![{\displaystyle n}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a601995d55609f2d9f5e233e36fbe9ea26011b3b)
wird, umso besser ist die Approximation der Binomialverteilung durch die Poisson-Verteilung.
Die Poisson-Approximation ist in der Wahrscheinlichkeitsrechnung eine Möglichkeit, die Binomialverteilung und die verallgemeinerte Binomialverteilung für große Stichproben und kleine Wahrscheinlichkeiten durch die Poisson-Verteilung anzunähern. Durch den Grenzübergang nach unendlich erhält man dann die Konvergenz in Verteilung der beiden Binomialverteilungen gegen die Poisson-Verteilung.
Formulierung
Ist
eine Folge binomialverteilter Zufallsvariablen mit Parametern
und
, sodass für die Erwartungswerte
für
gilt, dann folgt
![{\displaystyle P(S_{n}=k)=B_{n,p_{n}}(\{k\})\to \,{\frac {\lambda ^{k}}{k!}}\mathrm {e} ^{-\lambda }=P_{\lambda }(\{k\})\quad }](https://wikimedia.org/api/rest_v1/media/math/render/svg/58efc1de9f5741246c59306df11425b2219ba0ec)
für
.
Beweis-Skizze
Der Wert einer Poisson-verteilten Zufallsvariable an der Stelle
ist der Grenzwert
einer Binomialverteilung mit
an der Stelle
:
![{\displaystyle {\begin{aligned}\lim _{n\to \infty }P(S_{n}=k)&=\lim _{n\to \infty }{\binom {n}{k}}p^{k}(1-p)^{n-k}\\&=\lim _{n\to \infty }{\frac {n!}{k!\,(n-k)!}}\left({\frac {\lambda }{n}}\right)^{k}\left(1-{\frac {\lambda }{n}}\right)^{n-k}\\&=\lim _{n\to \infty }\left({\frac {\lambda ^{k}}{k!}}\right)\left({\frac {n(n-1)(n-2)\cdots (n-k+1)}{n^{k}}}\right)\left(1-{\frac {\lambda }{n}}\right)^{n}\left(1-{\frac {\lambda }{n}}\right)^{-k}\\&={\frac {\lambda ^{k}}{k!}}\cdot \lim _{n\to \infty }\underbrace {\left({\frac {n}{n}}\cdot {\frac {n-1}{n}}\cdot {\frac {n-2}{n}}\cdots {\frac {n-k+1}{n}}\right)} _{\to 1}\underbrace {\left(1-{\frac {\lambda }{n}}\right)^{n}} _{\to e^{-\lambda }}\underbrace {\left(1-{\frac {\lambda }{n}}\right)^{-k}} _{\to 1}\\&={\frac {\lambda ^{k}\mathrm {e} ^{-\lambda }}{k!}}.\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/86c21f09145f897657bdad6179f4bf545f08f56d)
Bei großen Stichproben und kleinem
lässt sich folglich die Binomialverteilung gut durch die Poisson-Verteilung approximieren.
Die Darstellung als Grenzwert der Binomialverteilung erlaubt eine alternative Berechnung von Erwartungswert und Varianz der Poisson-Verteilung. Seien
unabhängige bernoulliverteilte Zufallsvariablen mit
und sei
. Für
gilt
und
![{\displaystyle {\begin{aligned}\operatorname {E} (S_{n})&=\operatorname {E} (X_{1})+\dotsb +\operatorname {E} (X_{n})=\underbrace {{\frac {\lambda }{n}}+\dotsb +{\frac {\lambda }{n}}} _{n\,\mathrm {mal} }=\lambda \to \lambda \\\operatorname {Var} (S_{n})&=\operatorname {Var} (X_{1})+\dotsb +\operatorname {Var} (X_{n})\\&=\underbrace {{\frac {\lambda }{n}}\left(1-{\frac {\lambda }{n}}\right)+\dotsb +{\frac {\lambda }{n}}\left(1-{\frac {\lambda }{n}}\right)} _{n\,\mathrm {mal} }=\lambda \left(1-{\frac {\lambda }{n}}\right)\to \lambda .\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0b95d68f43027bf51824f136e2eb84cdc80ad491)
Güte der Approximation
Für die Fehlerabschätzung gilt
.
Die Approximation einer Summe von Bernoulli-verteilten Zufallsvariablen (bzw. einer binomialverteilten Zufallsvariable) ist also insbesondere für kleine
gut. Als Faustregel gilt, dass die Approximation gut ist, wenn
und
gilt. Ist
, so ist die Normal-Approximation besser geeignet.
Verallgemeinerung
Allgemeiner lässt sich Folgendes zeigen: Sind
stochastisch unabhängige Zufallsvariablen mit
(Jede Zufallsvariable ist also Bernoulli-verteilt). Dann ist
![{\displaystyle S:=\sum _{i=1}^{n}X_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ed3b5520318e3b762cd6b0c820f87dca0d06ccea)
verallgemeinert binomialverteilt und es ist
.
Dann gilt
.
Gilt
für alle
, so ist
binomialverteilt und das obige Ergebnis folgt sofort.
Beispiel
Ein Individuum einer Spezies zeugt
Nachkommen, die alle stochastisch unabhängig voneinander mit einer Wahrscheinlichkeit von
das geschlechtsreife Alter erreichen. Interessiert ist man nun an der Wahrscheinlichkeit, dass zwei oder mehr Nachkommen das geschlechtsreife Alter erreichen.
Exakte Lösung
Sei
die Zufallsvariable „Der
-te Nachkomme erreicht das geschlechtsreife Alter“. Es gilt
und
für alle
. Dann ist die Anzahl der überlebenden Nachkommen
aufgrund der stochastischen Unabhängigkeit
-verteilt.
Zur Modellierung definiert man den Wahrscheinlichkeitsraum
mit der Ergebnismenge
, der Anzahl der überlebenden geschlechtsreifen Nachkommen. Die σ-Algebra ist dann kanonisch die Potenzmenge der Ergebnismenge:
und als Wahrscheinlichkeitsverteilung die Binomialverteilung:
.
Gesucht ist
. Es erreichen also mit einer Wahrscheinlichkeit von ca. 26 % mindestens zwei Individuen das geschlechtsreife Alter.
Approximierte Lösung
Da
ausreichend groß und
ausreichend klein ist, lässt sich die Binomialverteilung genügend genau mittels der Poisson-Verteilung annähern. Diesmal ist der Wahrscheinlichkeitsraum
definiert mittels des Ergebnisraums
, der
-Algebra
und der Poisson-Verteilung als Wahrscheinlichkeitsverteilung
mit dem Parameter
. Man beachte hier, dass die beiden modellierten Wahrscheinlichkeitsräume unterschiedlich sind, da die Poisson-Verteilung auf einem endlichen Ergebnisraum keine Wahrscheinlichkeitsverteilung definiert.
Die Wahrscheinlichkeit, dass mindestens zwei Individuen das geschlechtsreife Alter erreichen, ist also
.
Bis auf vier Nachkommastellen stimmt also die exakte Lösung mit der Poisson-Approximation überein.
Weblinks
Literatur
- Achim Klenke: Wahrscheinlichkeitstheorie. 3. Auflage. Springer-Verlag, Berlin Heidelberg 2013, ISBN 978-3-642-36017-6, doi:10.1007/978-3-642-36018-3.
- Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik. Für Studium, Berufspraxis und Lehramt. 8. Auflage. Vieweg, Wiesbaden 2005, ISBN 3-8348-0063-5, doi:10.1007/978-3-663-09885-0.
- Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, doi:10.1515/9783110215274.