A-posteriori-Wahrscheinlichkeit

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von A-posteriori-Verteilung)

Die A-posteriori-Wahrscheinlichkeit ist ein Begriff aus der bayesschen Statistik. Sie beschreibt den Wissensstand über einen unbekannten Umweltzustand a posteriori, d. h. nach der Beobachtung einer Zufallsgröße , die von in statistischer Abhängigkeit steht.

Definition

Folgende Situation ist gegeben: ist ein unbekannter Umweltzustand (z. B. ein Parameter einer Wahrscheinlichkeitsverteilung), der auf der Basis von Beobachtungen einer Zufallsgröße geschätzt werden soll.

Gegeben sei eine Verteilung für den Parameter vor der Beobachtung der Stichprobe. Diese Verteilung wird auch A-priori-Verteilung genannt.

Weiterhin sei die Dichte (bzw. im diskreten Fall: die Wahrscheinlichkeitsfunktion) der bedingten Verteilung der Stichprobe unter der Bedingung gegeben. Diese Dichte (bzw. Wahrscheinlichkeitsfunktion) wird im Folgenden mit bezeichnet.

Die A-posteriori-Verteilung ist die Verteilung des Populationsparameters unter der Bedingung, dass für die Zufallsgröße der Wert beobachtet wurde. Die A-posteriori-Verteilung wird mit Hilfe des Satzes von Bayes aus der A-priori-Verteilung und der bedingten Verteilung der Stichprobe unter der Bedingung berechnet.

A-posteriori-Verteilung

Für stetige A-priori-Verteilungen

Eine stetige A-priori-Verteilung liegt dann vor, wenn die A-priori-Verteilung auf der Menge der reellen Zahlen oder auf einem Intervall in definiert ist. Beispiele für stetige A-priori-Verteilungen sind:

  • die Normalverteilung (hier ist der Parameterraum die Menge der reellen Zahlen) oder
  • die Gleichverteilung auf dem Intervall (hier ist der Parameterraum das Intervall ).

Im Folgenden steht für die auf dem Parameterraum definierte A-priori-Dichte von

In diesem Fall kann die A-posteriori-Dichte folgendermaßen berechnet werden:[1]

Für diskrete A-priori-Verteilungen

Im folgenden Abschnitt steht für die diskrete A-priori-Wahrscheinlichkeit, dass der Parameter den Wert annimmt. Eine diskrete A-priori-Verteilung ist auf einer endlichen Menge oder auf einer Menge mit abzählbar unendlichem Träger definiert.

Die A-posteriori-Wahrscheinlichkeit wird im Folgenden mit bezeichnet und kann auf folgende Weise berechnet werden:[1]

Bedeutung in der bayesschen Statistik

In der bayesschen Statistik stellt die A-posteriori-Verteilung den neuen, durch Vorwissen und Beobachtung bestimmten Kenntnisstand über die Verteilung des Parameters nach der Beobachtung der Stichprobe dar.

Damit ist die A-posteriori-Verteilung die Grundlage zur Berechnung aller Punktschätzer (siehe Bayes-Schätzer) und Glaubwürdigkeitsintervallen.[1]

Beispiel

In einer Urne befinden sich rote und schwarze Kugeln. Es ist bekannt, dass der Anteil roter Kugeln entweder bei 40 % oder aber bei 60 % liegt. Um Genaueres herauszufinden, werden (mit Zurücklegen) 11 Kugeln aus der Urne gezogen. Es werden 4 rote und 7 schwarze Kugeln gezogen.

Die Zufallsgröße „Anzahl gezogener roter Kugeln“ wird im Folgenden mit bezeichnet, der tatsächlich beobachtete Wert der Zufallsgröße mit .

Die Zufallsgröße ist binomialverteilt mit unbekanntem Parameter wobei nur einen der Werte oder annehmen kann. Da kein weiteres Vorwissen bekannt ist, wird als A-priori-Verteilung für eine diskrete Gleichverteilung angenommen, d. h.

Die Wahrscheinlichkeitsfunktion für ergibt sich aus der Binomialverteilung zu

Man erhält daher für

Für erhält man

Die A-posteriori-Verteilung kann nun mit Hilfe des Satzes von Bayes berechnet werden. Für erhält man als A-posteriori-Wahrscheinlichkeit

Für ergibt sich die A-posteriori-Wahrscheinlichkeit

Somit ist nach Ziehung der Stichprobe die Wahrscheinlichkeit, dass der Anteil roter Kugeln in der Urne 40 % beträgt, gleich .

Siehe auch

Einzelnachweise

  1. a b c Bernhard Rüger (1988), S. 152 ff.

Literatur

  • Bernhard Rüger: Induktive Statistik. Einführung für Wirtschafts- und Sozialwissenschaftler. R. Oldenbourg Verlag, München Wien 1988. ISBN 3-486-20535-8
  • Hans-Otto Georgii: Stochastik – Einführung in die Wahrscheinlichkeitstheorie und Statistik. de Gruyter Verlag, Berlin New York 2007. ISBN 978-3-11-019349-7