Diskussion:Hypergeometrische Verteilung

aus Wikipedia, der freien Enzyklopädie

Ich kenne die Schreibweise H(N, M, n) und denke, dass sie zumindest nicht unüblich ist. Vielleicht lässt sie sich irgendwie noch im Text erwähnen, damit auch diejenigen, die andere Literatur haben, Parallelen ziehen können. 82.82.120.218 19:50, 9. Jan 2004 (CET)

Binomialkoeffizient

Ist es wirklich im Sinne des Erfinders, wenn statt des Binomialkoeffizienten "( 20 über 4 )" dasteht, m.a.W. trete ich jemandem auf die Zehen, wenn ich es zum Binomialkoeffizienten umschreibe? Können die Wahrscheinlichkeiten in der Tabelle auf 4 Dezimalstellen reduziert werden? Nicht, dass ich das Lebenswerk von jemandem zerstöre! ;-) --Philipendula 15:23, 1. Jul 2004 (CEST)

Vom Gedanken der Autorenschaft muss man sich sowieso hier lösen - es kommt allein darauf an, den perfekten Artikel zu bekommen, also trau dich. -- Nichtich 20:48, 1. Jul 2004 (CEST)
Es könnte halt sein, dass die "( 20 über 4 )"-Schreibweise auch üblich ist, z.B in Schulen, die manchmal eine etwas verquere Art der Darstellung haben. In diesem Fall hätte natürlich die obige Schreibweise die selbe Berechtigung wie meine, obwohl mir das schon etwas gewöhnungsbedürftig vorkommt. --Philipendula 22:50, 1. Jul 2004 (CEST)

Darstellung der W'funktion

Ich habe meine sämtlichen Statistikbücher gewälzt. In mindestens 80%, auch englischen, wurde für die Parameter der HV N, M und n gewählt. Auch die Bezeichnung war meistens ähnlich wie bei mir, h(x|N,M,n). Wegen des Wiedererkennungswertes erschien mir eine Umformulierung angebracht, auch auf die Gefahr hin, Schläge zu kriegen.

Auch habe ich die Unterschiede zwischen W'funktion und Verteilung stärker herausgehoben.

--Philipendula 23:54, 1. Jul 2004 (CEST)

Umsetzung in TeX, Umformung in h(x|N,M,n), letzten Abschnitt nach oben geholt, teilweise formelmäßig verändert. --Philipendula 00:54, 2. Jul 2004 (CEST)

Ich finde es nervig, dass jeder Matheprofessor meint, sich durch eigene Kürzel profilieren zu müssen. Man ist ja gezwungen, sich eine Vergleichstabelle anzulegen; hier der Anfang einer solchen, ist vielleicht für manche ganz hilfreich:

GG/universe: Standard ist 'N', P.Boley 'τ' (tau); 'n' (Schülerduden, unsinnig!).

Mark.Teilmenge (=max. Treffer): 'M' (Altmann, Schlittgen, Hartung); 'N1' (Sachs, Boley); 'w' (=weiß, Schülerduden).

(2.)Ziehg./gezogene Tupel: meist 'n' (en.wiki, Sachs, Boley, Altmann); 'k' (Hartung); 'r' (?); 'm' (natürl.Schülerduden).

davon markiert/Treffer: 'x' (Thompson 92, Standard für Unbekannte) 'x1'; 'k' (en.wiki, Schülerduden);'m' (Altmann); 'a' ("agreements", Holm u.a., Linguistik).

Bestimmt läßt sich das sehr weit fortsetzen bzw. ergänzen. (HJJHolm 09:34, 14. Dez. 2006 (CET))

Warum hypergeometrisch?

Warum nennt man diese Verteilung eigentlich hypergeometrisch? Hat das etwas mit den Mengen zu tun, die im ersten Absatz genannt werden? Ich begreife diesen Teil des Textes sowieso nicht ganz; liegt vielleicht auch daran, dass ich nicht weiß, was der Autor unter unabhängigen Mengen versteht. --Saraedum 19:49, 6. Aug 2005 (CEST)

Das interessiert mich auch woher der Name kommt. Ich könnte mir vorstellen, dass der Name vom Begriff der geometrischen Folge abgeleitet ist. Bei einer geometrischen Folge ist der Quotient zweier benachbarter Folgenglieder immer konstant q. Bei einem hypergeometrischen Zufallsexperiment wie z.B. n-faches Ziehen von M roten und (N-M) blauen Kugeln aus einer Urne mit N Kugeln ohne Zurücklegen, ändern sich die Einzelwahrscheinlichkeiten p = M/N für eine rote und 1-p für eine blaue Kugel durch das Nichtzurücklegen ständig, da nach jeder Ziehung N um 1 verringert wird. Diese Änderungen könnten man mit der Vorsilbe "Hyper" ausdrücken wollen. Ich habe das aber noch nie irgendwo nachlesen können. Eventuell weiß dazu jemand hier mehr oder kann mich korrigieren. --Carrois (Diskussion) 12:48, 17. Jan. 2015 (CET)

Ganz intuitiv hätte ich jetzt gesagt, dass der Name daher kommt, dass ihre wahrscheinlichkeitserzeugende Funktion die hypergeometrische Funktion beinhaltet, siehe Hypergeometrische Verteilung#Wahrscheinlichkeitserzeugende Funktion. Die hypergeometrische Funktion kann wiederum durch die hypergeometrische Reihe dargestellt werden, die eine Verallgemeinerung der geometrischen Reihe ist, bei der das Verhältnis aufeinanderfolgender Glieder nicht mehr konstant sein muss. Grüße, --Quartl (Diskussion) 13:55, 17. Jan. 2015 (CET)

Charakteristische Funktion

Was ist das 'p' in der charakteristischen Funktion? --141.76.10.46 19:12, 23. Jul 2006 (CEST) Wenn p=M/N, dann steht hier die falsche charakteristische Funktion - nämlich die der Binomialverteilung zu p.

Die charakteristische Funktion sollte falsch sein. Schließlich müsste sonst die erzeugende Funktion $(1-p + pz)^n$ (mit $z=e^{is}$) sein. Da die erzeugende Funktion aber eindeutig die Verteilung festlegt, müsste die ZVar damit Bin(n,p)-verteilt sein - unabhängig von dem eigentlichen Wert von $p\in[0,1]$.

Einführung

Kann sein, dass ich mich irre, da ich grade erst das zweite Mal Stochastik im Unterricht behandele, aber wird in der Einführung X bzw. x in der gleichen Funktion verwendet wie im späteren Artikel k?

Ich fand das ganze sehr verwirrend aber lasse mich natürlich gern eines besseren belehren.

Richtig. Und gemäß wiki-Regeln sollen die Leser - zumindest in der Einleitung - allgemeinverständlich informiert werden.

Einführung II

Am Ende der Einführung wird auf ein "anschauliches" Beispiel verwiesen: "In einer Urne befinden sich 45 Kugeln, 20 davon sind gelb. Wie hoch ist die Wahrscheinlichkeit in einer 10-elementigen Stichprobe genau 4 gelbe Kugeln zu ziehen?" Warum wird dieses "anschauliche" Beispiel nicht gleich auf das bekannte Lottospiel übertragen: "In einer Lostrommel mit 49 durchnummerierten Kugeln befinden sich sechs von mir als Gewinnzahlen notierte Kugeln. Wie hoch ist die Wahrscheinlichkeit, dass beim Ziehen von 7 Kugeln genau 5 Gewinnzahlen darunter sind?" Wahrscheinlichkeiten für das Lottospiel 6 aus 49 werden im Verlauf des Artikels doch auch angegeben. Die Rolle der Zusatzzahl muss ja erst einmal nicht im Term berücksichtigt werden. --Ruppert 22:27, 1. Dez. 2008 (CET)

Fehler wegen unvollständiger Berücksichtigung der Sortierung?

Die Definition und das Kugelbeispiel scheinen einen Fehler aufzuweisen, weil sie die Sortierung nicht vollständig berücksichtigen. Kombinatorisch werden nur (M über k) x (N-M über n-k) Treffermöglichkeiten betrachtet, also zuerst die Kugeln aus der gelben Menge, dann die aus der violetten. Allerdings gibt es auch die Möglichkeit, dass zuerst eine violette und danach eine gelbe Kugel gezogen wird.

Ein einfaches Beispiel: Seien zwei Kugeln (N=2), davon eine gelb (M=1), die andere violett. Wie hoch ist die Wahrscheinlichkeit, dass bei Ziehung von zwei Kugeln (n=2) eine gelbe (k bzw. x=1) enthalten ist? Natürlich muss bei Ziehung aller Kugeln (n=N) die Wahrscheinlichkeit, dass alle gelben Kugeln gezogen werden (k=M), 100% betragen. Die zwei Möglichkeiten sind (gelb, violett) und (violett, gelb) - also stets eine gelbe Kugel. Die Formel ergibt aber: h(k|N,M,n) = (M über k) x (N-M über n-k) / (N über n) = h(1|2,1,2) = (1 über 1) x (2-1 über 2-1) / (2 über 2) = 1 x 1 / (2 x 1) = 0,5 = 50%.

Die Formel gibt also die Wahrscheinlichkeit dafür an, dass die ersten k Kugeln gelb und die restlichen violett sind! -- Karl Wiki 14:00, 12. Dez. 2009 (CET)

Die Reihenfolge der Kugeln spielt in der Formel keine Rolle. Es wird die Wahrscheinlichkeit dafür berechnet, dass die Kugeln "mit einem Griff" gezogen werden. Diese Formulierung ("mit einem Griff") soll bedeuten, dass die Kugeln keine Reihenfolge durch das Ziehverfahren aufgedrückt bekommen (es gibt keine "erste", "zweite", ... Kugel). Das könnte man tatsächlich auch so auslegen, dass nur eine ganz bestimmte Anordnung berücksichtigt wird: Z.B. könnte man die Kugeln erstmal nacheinander ziehen (statt mit einem Griff) und dann die Reihenfolge dadurch eliminieren, dass man die Kugeln der Farbe nach ordnet. Auch mit dieser Sichtweise passt die Formel ganz genau. Das "einfache Beispiel" ist falsch gerechnet, denn (2 über 2) = 1. 87.154.95.88 18:58, 20. Feb. 2011 (CET)

Anderer Fehler

Die Voraussetzung reicht nicht: FÜr ist und damit

undefiniert.

Es muss also zusätzlich gelten, also . -- UKoch (Diskussion) 21:17, 22. Aug. 2015 (CEST)

Die en:WP sieht das auch so (s. Inbox unter "Support"), also ändere ich den Artikel hier entsprechend. -- UKoch (Diskussion) 20:40, 26. Aug. 2015 (CEST)

Herleitung fehlt

In dem Artikel wird die Verteilung nicht hergeleitet. Hat nicht jemand Lust, eine gute Herleitung einzufügen ? Auch wäre es wünschenswert, Beweise für die weiteren Eigenschaften zu haben. (nicht signierter Beitrag von 85.176.129.185 (Diskussion) 10:34, 5. Jan. 2012 (CET))

Meinst du eine Herleitung wie die im Artikel Urnenmodell? Viele Grüße, --Quartl (Diskussion) 21:22, 22. Aug. 2015 (CEST)

Es existieren evtl. 2 Modi!

Die hypergeometrische Verteilung hat 2 Modalwerte (Modi), wenn der Bruch eine natürliche Zahl ist.

Dann sind die Modalwerte und .

Ansonsten ist der Modalwert eindeutig und

Einleitung - Verweis auf Variation

In der Einleitung wird auf die Variation ohne Wiederholung verwiesen. Dies ist meiner Ansicht nach irreführend, denn bei einer Variation kommt es ja auf die Reihenfolge der Elemente an, bei der Hypergeometrischen Verteilung nicht. Passend wäre ein Verweis auf die Kombination (Ziehen mit einem Griff). https://de.wikipedia.org/wiki/Kombination_(Kombinatorik)