Geburtstagsparadoxon
Das Geburtstagsparadoxon, manchmal auch als Geburtstagsproblem bezeichnet, ist ein Beispiel dafür, dass bestimmte Wahrscheinlichkeiten (und auch Zufälle) intuitiv häufig falsch geschätzt werden:
„Befinden sich in einem Raum mindestens 23 Personen, dann ist die Chance, dass zwei oder mehr dieser Personen am gleichen Tag (ohne Beachtung des Jahrganges) Geburtstag haben, größer als 50 %.“[1]
Zum falschen Schätzen der Wahrscheinlichkeit kommt es, weil im Geburtstagsparadoxon danach gefragt wird, wie wahrscheinlich es ist, dass zwei beliebige Personen aus einer Gruppe an ein und demselben beliebigen Tag im Jahr Geburtstag haben. Fälschlicherweise wird das Problem oft interpretiert als „wie wahrscheinlich es ist, dass eine bestimmte Person aus einer Gruppe an einem bestimmten Tag im Jahr Geburtstag hat“ (z. B. Übereinstimmung mit dem Geburtstag einer anderen, zusätzlichen Person), und diese Wahrscheinlichkeit ist tatsächlich deutlich kleiner.
Das Paradoxon wird oft Richard von Mises zugeschrieben, z. B. von Persi Diaconis und Frederick Mosteller.[2] Laut Donald E. Knuth ist dieser Ursprung nicht sicher: Das Geburtstagsparadoxon wurde informell unter Mathematikern schon in den 1930er Jahren diskutiert, ein genauer Urheber lässt sich aber nicht ermitteln.[3]
Eingrenzung
Frage: Wie hoch ist die Wahrscheinlichkeit, dass bei 23 Personen mindestens zwei von ihnen am selben Tag im Jahr Geburtstag haben?
Die Antwort ist für die meisten verblüffend und wird deshalb als paradox wahrgenommen. So schätzen die meisten Menschen die Wahrscheinlichkeit um eine Zehnerpotenz falsch ein. Sie liegt nicht (wie zumeist geschätzt) zwischen 1 % und 5 %, sondern über 50 %, bei 50 Personen sogar bei über 97 %.
Im Unterschied dazu steht die Wahrscheinlichkeit, dass jemand an einem ganz bestimmten Tag (ohne Beachtung des Jahrgangs) Geburtstag hat: Ist durch den Geburtstag einer der anwesenden Personen der bestimmte Tag festgelegt, sind weitere 253 Personen (also insgesamt 254 Personen) notwendig, um eine Wahrscheinlichkeit von 50 % zu erreichen (siehe den Artikel Binomialverteilung – Gemeinsamer Geburtstag im Jahr und weiter unten den Abschnitt Wahrscheinlichkeit für einen bestimmten Tag).
Der Grund für diesen großen Unterschied liegt darin, dass aus Personen verschiedene Paare gebildet werden können; die Zahl der möglichen Paare steigt daher mit wachsender Zahl der Personen in der Gruppe immer schneller an – wenn die -te Person dazukommt, steigt die Zahl der Paare um . Die Bedingung für das in Frage stehende Ereignis ist schon erfüllt, wenn ein einziges dieser Paare am gleichen Tag Geburtstag hat. Da die Wahrscheinlichkeit, am gleichen Tag Geburtstag zu haben, für jedes Paar gleich groß ist und die Anzahl der Paare mit wachsender Zahl an Personen immer schneller ansteigt, steigt auch die Wahrscheinlichkeit, dass zwei Personen in der Gruppe am gleichen Tag Geburtstag haben, mit wachsender Gruppengröße immer schneller an.
Ungleichmäßig verteilte Geburtstage
In der Realität sind nicht alle Geburtstermine gleich wahrscheinlich, so werden z. B. im Sommer mehr Kinder geboren als im Winter.[4] Dadurch nimmt die Wahrscheinlichkeit, dass zwei Personen am gleichen Tag Geburtstag haben, leicht zu.[5][6] Simulationen zeigen allerdings, dass auch für echte Daten die Wahrscheinlichkeit, dass zwei Personen am gleichen Tag Geburtstag haben, nach wie vor bei 23 Personen 50 % übersteigt.[7] Auch die Berücksichtigung des in der Herleitung vernachlässigten Schalttags ändert daran nichts.
Bedeutung in der Kryptographie
Dieser Effekt hat eine Bedeutung bei kryptographischen Hashfunktionen, die einen eindeutigen Prüfwert aus einem Text ergeben sollen. Es ist dabei viel einfacher, zwei zufällige Texte zu finden, die denselben Prüfwert haben, als zu einem vorgegebenen Text einen weiteren zu finden, der denselben Prüfwert aufweist (siehe Kollisionsangriff).
Mathematische Herleitungen
Im Folgenden wird der 29. Februar vernachlässigt und angenommen, dass die Geburtstage der Personen unabhängige, identisch verteilte Zufallsvariablen aus der diskreten Gleichverteilung auf der 365-elementigen Menge sind. Diese Annahme ist beispielsweise dann nicht erfüllt, wenn sich unter den anwesenden Personen Zwillinge befinden.
Im Urnenmodell entspricht diese Annahme einer Ziehung von Kugeln mit Zurücklegen aus einer Urne, die 365 Kugeln mit der Beschriftung „1. Januar“, „2. Januar“ usw. bis „31. Dezember“ enthält.
Wahrscheinlichkeit, dass mindestens zwei Personen am selben Tag Geburtstag haben
Die Anzahl aller möglichen Variationen ist für Personen , wobei alle Fälle gleich wahrscheinlich sind. Zum Beispiel ergeben sich für zwei Personen mögliche Fälle von Geburtstagsvariationen.
Von diesen möglichen Fällen beinhalten
nur unterschiedliche Geburtstage. Für die erste Person kann der Geburtstag frei gewählt werden, für die zweite gibt es dann 364 Tage, an denen die erste nicht Geburtstag hat etc.
Damit ergibt sich nach der Formel von Laplace die Wahrscheinlichkeit von
dass alle Personen an unterschiedlichen Tagen Geburtstag haben.
Die Wahrscheinlichkeit für mindestens einen doppelten Geburtstag im Verlauf eines Jahres ist somit:
Mithilfe der Ungleichung der Exponentialfunktion für ergibt sich
Wenn diese Wahrscheinlichkeit größer als 50 % ist, folgt daraus:
Diese Ungleichung ist für erfüllt.
Für ergibt sich:
Nach dem Schubfachprinzip ist (unter Vernachlässigung des 29. Februars) für alle die Wahrscheinlichkeit gleich 1, es gibt also mit Sicherheit zwei Personen mit gleichem Geburtstag. Wenn der 29. Februar als Geburtstag nicht vernachlässigt wird, dann gilt dies erst ab .
Eine Approximation
Der Ausdruck für P kann weiter umgeformt werden:
Mit der Stirlingformel lässt sich dies gut nähern zu
was man leicht mit einem Taschenrechner auswerten kann.
In einer Gruppe von 23 Personen muss man verschiedene Vergleiche anstellen, um einen vollständigen Überblick zu bekommen, ob es gemeinsame Geburtstage gibt, und wenn ja, wie viele.
Wahrscheinlichkeit für einen bestimmten Tag
Eine andere Frage liegt vor, wenn man nicht nach beliebigen Übereinstimmungen der Geburtstage sucht, sondern nach Übereinstimmung mit einem fest ausgewählten Tag im Jahr.
Ignoriert man wie bisher den 29. Februar, so ist die Wahrscheinlichkeit für eine Person, an einem solchen bestimmten Tag Geburtstag zu haben, gleich 1/365 ≈ 0,27 %.
Die Wahrscheinlichkeit für das Gegenteil, also die Wahrscheinlichkeit, an einem bestimmten Tag nicht Geburtstag zu haben, ist damit
Bei zwei Personen ist die Wahrscheinlichkeit, dass an dem vorher ausgewählten Tag keine von beiden Geburtstag hat, gleich (wie bisher nehmen wir an, dass die Geburtstage der Personen unabhängig sind).
Dabei mindestens einen Treffer zu haben (mindestens eine Person von zweien hat an einem bestimmten Tag Geburtstag), ist wieder die Gegenwahrscheinlichkeit:
So fortfahrend für größere Anzahlen von Personen erhält man: Die Wahrscheinlichkeit , dass mindestens eine Person von anwesenden Personen an einem bestimmten Tag Geburtstag hat, ist
Damit lässt sich ausrechnen, wie viele Personen man braucht, um eine bestimmte Wahrscheinlichkeit zu erreichen, dass mindestens eine Person an einem bestimmten Tag Geburtstag hat:
Für eine Wahrscheinlichkeit von 50 % benötigt man[8]
Personen. Wie beim vorigen Problem sind auch hier bei 253 Personen 253 Vergleiche mit dem bestimmten Datum erforderlich, um einen vollständigen Überblick über die Situation zu haben.
Schließlich errechnet sich für den Fall, dass eine der anwesenden Personen Geburtstag hat, die Wahrscheinlichkeit, dass von den übrigen Personen mindestens eine am gleichen Tag Geburtstag hat, zu
Im Unterschied zur Wahrscheinlichkeit, dass mindestens zwei Personen an einem Tag Geburtstag haben (siehe oben), gibt es hier kein für das man eine sichere Aussage treffen kann: Für jede Personenzahl gibt es die Möglichkeit, dass der ausgewählte Tag nicht als Geburtstag vorkommt (das Schubfachprinzip ist nicht anwendbar). Für alle gilt
Wahrscheinlichkeit, dass genau zwei Personen am selben Tag Geburtstag haben
Bei diesem Problem lautet das konkrete Ereignis: „2 Personen haben am gleichen Tag Geburtstag, alle anderen an unterschiedlichen Tagen.“
Es gibt 365 Möglichkeiten für den Tag des Doppelgeburtstags. Die beiden Personen lassen sich auf Arten auswählen. Die verbleibenden Personen werden nacheinander auf die restlichen 364 Tage verteilt, und zwar so, dass es keine weitere Mehrfachbelegung gibt. Dafür gibt es Möglichkeiten. Danach bleiben noch Tage des Jahres übrig, an denen niemand Geburtstag hat. Insgesamt erhält man für das Eintreten des Ereignisses günstige Fälle. Die gesuchte Wahrscheinlichkeit für das Eintreten des Ereignisses beträgt , da wieder alle 365 Tage des Jahres als gleich wahrscheinlich angenommen werden.
Die Wahrscheinlichkeiten stellen eine Zahlenfolge in Abhängigkeit von dar, die streng monoton bis wächst. Dort beträgt die Wahrscheinlichkeit rund 38,6 %. Danach fällt die Folge streng monoton. Ab ist die Wahrscheinlichkeit 0, da das Ereignis in diesen Fällen nicht mehr eintreten kann, weil es dann Mehrfachgeburtstage oder mehrere Doppelgeburtstage gibt.
Mehr als zwei Personen mit gleichem Geburtstag
Eine Verallgemeinerung der Fragestellung ist, aus wie vielen Personen eine Gruppe bestehen muss, damit die Wahrscheinlichkeit, dass mindestens Personen am selben Tag Geburtstag haben, größer als 50 % ist. Die folgende Tabelle zeigt die Mindestanzahl der Personen für :[9]
Mindestanzahl n von Personen | |
---|---|
m | n |
2 | 23 |
3 | 88 |
4 | 187 |
5 | 313 |
6 | 460 |
7 | 623 |
8 | 798 |
9 | 985 |
10 | 1181 |
Beispielhafte Erläuterung zum Auftreten des scheinbaren Paradoxons
Wie bei vielen Problemen der Kombinatorik und Wahrscheinlichkeit kommt es auch hier auf den genauen Kontext bzw. den Ablauf des Experimentes an. Denken wir uns folgende Experimente. Zur Vereinfachung habe ein Jahr immer exakt 365 Tage.
Eine bestimmte Person an einem bestimmten Tag
Peter hat am 19. Januar Geburtstag. Peter hat 365 Freunde, die alle an einem unterschiedlichen Tag Geburtstag haben. Die Wahrscheinlichkeit, dass ein bestimmter, ausgewählter Freund ebenfalls am 19. Januar Geburtstag hat, beträgt . Bei zwei ausgewählten Freunden beträgt diese Wahrscheinlichkeit schon . Mit jedem weiteren Freund erhöht sich die Wahrscheinlichkeit um , bis schließlich bei 365 Freunden die Wahrscheinlichkeit beträgt.
Beliebige Personen an einem beliebigen Tag
Ändern wir das Experiment dahingehend, dass nicht der bestimmte Geburtstag (hier: 19. Januar) einer bestimmten Person (hier: Peter) gefragt ist. Diesmal sei Peters Geburtstag und der seiner Freunde an einem beliebigen Tag. In diesem Experiment fragen wir nach der Wahrscheinlichkeit, dass beliebige Personen in einem Raum an einem beliebigen Tag zusammen Geburtstag haben. Dazu werden wir die Wahrscheinlichkeit zunächst nur in einer Überschlagsrechnung bestimmen. Nacheinander werden wir Peters Freunde zum Experiment hinzuziehen. Die Wahrscheinlichkeit, dass sein Freund Ulf am selben Tag Geburtstag feiert, beträgt . Beim weiteren hinzugezogenen Freund namens Rainer beträgt die approximierte Wahrscheinlichkeit schon . Die Wahrscheinlichkeit erhöht sich um , weil Rainer zusammen mit Peter oder Ulf Geburtstag haben könnte. Bei der nächsten hinzugezogenen Person namens Robert beträgt die überschlagene Wahrscheinlichkeit dementsprechend schon . Die Wahrscheinlichkeit steigt hier im Vergleich zum vorherigen Experiment rapide an. Das scheinbare Paradoxon entsteht dadurch, dass mit jeder weiteren Person auch die Anzahl potentieller Paare mit gemeinsamem Geburtstag steigt.
Allerdings handelt es sich hierbei um Überschlagswerte. Es wurde nämlich bisher nicht die Möglichkeit berücksichtigt, dass bei der Personengruppe evtl. schon einige Personen zusammen Geburtstag haben könnten. Wird Rainer zum Experiment hinzugezogen, erhöht sich die Wahrscheinlichkeit nicht um , da wir berücksichtigen müssen, dass Ulf und Peter evtl. schon gemeinsam Geburtstag feiern. Die gesuchte Wahrscheinlichkeit ist somit etwas kleiner als . Mit Robert liegt die Wahrscheinlichkeit auch wieder etwas unter dem Wert von , da auch hier evtl. schon einige der anwesenden Personen (Peter, Ulf und Rainer) zusammen Geburtstag haben.
Verwandte Fragen
Bei dem Spiel Memory sind die Paare unter Karten (bestehend aus Paaren) aufzudecken. Zu Beginn des Spiels liegen alle Karten verdeckt, und solange nur verschiedene Karten aufgedeckt werden, haben die Spieler nur zufällig die Möglichkeit, ein Paar zu finden. Deshalb stellt sich die Frage – ähnlich wie beim Geburtstagsparadoxon – wie viele Karten man aufdecken muss, um mit einer gewissen Wahrscheinlichkeit (z. B. 50 %) mindestens ein Paar zu bekommen.
Die Anzahl der verschiedenen Motive entspricht hier der Anzahl der Tage im Jahr (365) im Geburtstagsparadoxon. Üblicherweise wird Memory mit 32 Paaren gespielt, es gibt aber auch andere Varianten, sodass es sinnvoll ist, die Zahl variabel zu halten.
Setzt man für die Wahrscheinlichkeit, durch Aufdecken von Karten nur verschiedene Karten aufzudecken, so gilt:
Als Ergebnis bekommt man für Bei Aufdecken von 10 Karten ist die Wahrscheinlichkeit größer als 50 %, mindestens ein Paar zu erhalten Für liegt die Grenze bei 12 Karten. Bei einem hypothetischen Memory mit 183 Paaren muss man 23 Karten aufdecken, bei 365 Paaren sind 32 Karten notwendig.[10]
Dieses Ergebnis hat wichtige praktische Auswirkungen auf das Spiel, da die Spieler die Lust verlieren würden, wenn es zu lange dauert, bis das erste Paar aufgedeckt wird.
Siehe auch
- Das Sammelbilderproblem behandelt eine ähnliche Frage. Hier geht es – übertragen auf die Beobachtung von Geburtstagen in einer Gruppe von Menschen – darum, wie viele Personen ausgewählt werden müssen, damit jeder Tag des Jahres als Geburtstag einer der Personen vorkommt.
- Das Ziegenproblem wird oft als Beispiel dafür herangezogen, dass der menschliche Verstand zu Trugschlüssen neigt, wenn es um das Bestimmen von Wahrscheinlichkeiten geht.
- Auch das Lincoln-Kennedy-Mysterium ist ein Phänomen, das mit der Übereinstimmung von biographischen Daten zu tun hat.
Weblinks
Einzelnachweise
- ↑ Richard von Mises: Über Aufteilungs- und Besetzungswahrscheinlichkeiten. Revue de la Faculté de Sciences de l’Université d’Istanbul N.S., 4. 1938–39, S. 145–163.
- ↑ P. Diaconis, F. Mosteller: Methods for Studying Coincidences. In: Journal of the American Statistical Association. 84, 4, S. 853–861.
- ↑ Donald E. Knuth: The Art of Computer Programming. Bd. 3: Sorting and Searching. Second Edition, ISBN 0-201-89685-0. S. 513.
- ↑ Emma Hawe, Alison Macfarlane and John Bithell: Daily and seasonal variation in live births, stillbirths and infant mortality in England and Wales, 1979–96. In: Health Statistics Quarterly. 9 Spring 2001 (PDF; 180 kB), S. 7: „There was a clear seasonal pattern in the number of daily live births throughout the entire period, with lower numbers of births in the winter than the summer months.“
- ↑ D. Bloom (1973): A birthday problem. American Mathematical Monthly, Bd. 80, S. 1141–1142 enthält einen Beweis mit Lagrange-Multiplikatoren, dass für nicht gleichmäßig verteilte Geburtstage die Wahrscheinlichkeit zunimmt, dass zwei Personen am gleichen Tag Geburtstag haben.
- ↑ Stefan Kirchner in de.sci.mathematik, 3. November 2005.
- ↑ Hugo Pfoertner in de.sci.mathematik, 22. Januar 2005.
- ↑ Im Folgenden wird die sog. Ceil-Funktion verwendet:
ist für jede reelle Zahl die kleinste ganze Zahl, die nicht kleiner als ist, z. B. - ↑ Folge A014088 in OEIS
- ↑ Dass man bei 183 (≈ 365/2) die gleiche Zahl bekommt wie beim Geburtstagsparadoxon, ist kein Zufall: Die Produktdarstellung für die Wahrscheinlichkeit zeigt (zumindest für die ersten Faktoren) eine große Ähnlichkeit.