Diskussion:Chi-Quadrat-Verteilung

aus Wikipedia, der freien Enzyklopädie

Verständlichkeit (erste Diskussion)

Ich habe vor einigen Jahren mal was über die Chi-Quadrat-Verteilung gelernt und konnte sie auch berechnen. Jetzt brauche ich sie zufällig mal wieder und wollte hier nachlesen, was ich so über die Jahre vergessen habe. Ich habe kein Wort verstanden. Muss das wirklich aussehen wie in einer Doktorarbeit? Ich würde eigentlich erwarten bzw. hoffen, dass die Artikel der Wikipedia auch für Nicht-Fach-Akademiker lesbar bleiben.

Bitte, bitte, liebe Mathematiker, schreibt eure Artikel so, dass sie den Sachverhalt erklären. Damit würdet ihr auch helfen, die allgemeine Verständnislosigkeit gegenüber der Mathematik abzubauen. -- Terabyte 15:46, 18. Apr 2004 (CEST)

Bitte bitte, wenn du etwas über die Chi-Quadrat-Verteilung (die ich nicht kenne) weißt, und das einfacher formulieren kannst, dann tue es. Und wenn eine eventuell vorhandene Gliederung des Artikels dabei umgeworfen wird, macht das nichts. Sortieren und umformulieren ist leichter als neuschreiben. Gerade Nicht- und Halbmathematiker tragen viel dazu bei, mathematische Artikel lesbarer zu machen. Es ist halt schwierig, etwas das man gut kennt, zum ersten mal so zu erklären, dass es andere verstehen.
Auch ich wünsche mir, dass wesentliche Teile der mathematischen Artikel auch von Lesern verstanden werden können, die den beschriebenen Begriff noch nicht kennen, oder - wie du - vor einiger Zeit mal besser kannten. Allerdings hat auch das seine Grenzen in der Vorkenntnis der zugrundeliegenden Begriffe.
Mir ging es kürzlich so, dass ich bestimmte Informationen über Dreiecke suchte, und sie nicht gleich fand. Schließlich fand ich einen Artikel, wo es viel allgemeiner als ich es brauchte drinstand, und so habe ich die spezielle Information eingetragen und den Artikel prominenter verlinkt, damit andere dieselbe Information schneller finden. Man muss halt viel selbst machen - und zwar jeder hier. --SirJective 22:08, 20. Apr 2004 (CEST)
Wie wäres zu Beginn, den Zweck dieses Konzepts zu Erläutern, oder in Neusprech: den Usecase für die Chi-Quadrat-Verteilung zu erläutern. Wenn oben die Frage "Welches Problem kann mit der Chi-Quadrat-Verteilung gelöst werden?" beantwortet wird, fällt es wesentlich einfacher, den weiteren Gedanken zu folgen. Ich glaube das sprengt das Lemma, aber als erster Absatz eine mögliche Einleitung -- Kurellajunior 15:12, 26. Mai 2010 (CEST)
Ich denke man könnte gut einen Abschnitt Anwendung gebrauchen und dafür evtl. einiges aus Chi-Quadrat übernehmen. Die Verbalisierung Die Chi-Quadrat-Verteilung ... der Varianz einer Stichprobe auftreten können. ist nicht sehr hilfreich (mal abgesehen davon, dass es auch ungenau ist). -- Sigbert 16:09, 26. Mai 2010 (CEST)
IMHO werden mathematische Artikel dann schwer verständlich, wenn schon in der allgemeinen Einleitung/Erläuterung die wesentlichen Informationen nicht an den/die Leser/Leserin gebracht werden können. Man verliert sich dabei in einem Netz aus mathematischen Artikeln, indem man sich beispielsweise immer wieder tiefergehend über Begrifflichkeiten informieren möchte. Ab einem bestimmten Weg, einer bestimmten Tiefe in der Wikipedia ist man als Leser dann nicht mehr gewillt oder nicht mehr in der Lage eine Sache nachzuvollziehen. Das ist hier deutlich der Fall, da der Weg aus dem Artikel heraus in einen anderen bereits im ersten Satz erfolgt. Es gilt also mathematische Begrifflichkeiten, deren Bedeutung nicht dem natürlichen Vokabular des Lesers entspricht, zu vermeiden. Noch schwieriger wird es, wenn Begriff gar in ihrer mathematischen Notation verwendet werden, sodass sie nicht einmal mehr als Begriff nachgeschlagen werden können. Nur Wissende haben dann die Chance Bekanntes in diesem Artikel zu rekaptulieren. Interessierte sind dann jedoch nicht mehr in der Lage, den Inhalt für sich zu gewinnen. So geschehen im zweiten Satz der Einleitung:
<quote>Betrachtet man Zahlen, die aus einer standardnormalverteilten Grundgesamtheit stammen, so ist ihre Summe , wobei bedeutet: "ist verteilt wie". Die Verteilung der entsprechenden Quadratsumme lässt sich ebenfalls mathematisch beschreiben. Sie ist unter dem Namen Chi-Quadrat-Verteilung bekannt.</quote>
Zwar kann man aus dem Kontext bei genauem Blick auf die einzelnen Links im Kontext schlussfolgern, dass es sich hier um Notationen der Normalverteilung handelt, jedoch ist auch das eine Hürde. Ein Anfang ist es vielleicht, die Dinge nicht mathematisch Exakt beschreiben zu wollen. Es geht ja um eine Einleitung, die messerscharfe Definition kommt dann im Folgenden und bietet den Fortgeschrittenen die Informationen, die sie suchen. Ziel sollte es sein, dass in den ersten Zeilen auch jemand ohne höhere Bildung einen kurzen Einblick bekommt. Hier diskutieren nun wahrscheinlich Wikipedianer mit akad. Hintergrund, was eigentlich zeigt, dass hier wirklich mal jemand draufschauen muss.
und bitte nicht böse sein, dass das hier keine neue Artikelversion sondern eine ein Handlungsaufruf ist. Wenn ich es kann, ich helfe sonst gerne direkt in Artikeln mit :-) --90.186.4.127 21:18, 16. Okt. 2011 (CEST)
Niemand ist böse, wir sind für jede Hilfe dankbar :) Ich habe mal den angesprochenen Block im Einleitungstext entmathematisiert und gekürzt. Besser? --Sigbert 22:39, 16. Okt. 2011 (CEST)
Jetzt ist das \sim Zeichen nicht mehr erklärt... --131.220.161.244 10:44, 17. Okt. 2011 (CEST)
Ist erledigt --131.220.161.244 19:17, 20. Okt. 2011 (CEST)

Gammaverteilung

Im Artikel steht

Alt:

und ihre Verteilungsfunktion
Die folgenden Bezeichnungen wurden hier verwendet: für die Gammafunktion und für die regularisierte unvollständige Gammafunktion.

Mein Vorschlag:

und ihre Verteilungsfunktion
Die folgenden Bezeichnungen wurden hier verwendet: für die Gammafunktion und für die Gammaverteilung mit den Parametern b und p.

Oder hab ich da was nicht kapiert?? --Philipendula 21:04, 11. Jul 2004 (CEST)

Sicher meinst du sowas wie
Aber dazu kann ich mich nicht inhaltlich aeussern. --SirJective 18:34, 22. Jun 2005 (CEST)

Näherung durch Normalverteilung

Hi!

Als Newbie hatte ich ja erst etwas Hemmungen, aber nach dem Prinzip "Sei mutig!" hab ich dann doch was hinzugefügt. Und zwar die Annahme, dass mit näherungsweise eine Normalverteilung gilt. Kann das jemand bestätigen?

Maddin79

Ja stimmt. Brav! ;-) --Philipendula 11:26, 10. Aug 2004 (CEST)

Also in meinem Buch steht, wenn ich es verstanden habe, dass man ab df>= 30 eine annähernde Normalverteilung erreicht. Und zwar so: Wenn ich für df=30 einen Chi-Quadrat-Wert suche, der 95% der Fläche abschneidet, ergibt sich ein Wert von 43,77. Mit der Formel z=(Wurzel aus 2 mal diesen Chi-Quadrat-Wert) minus (Wurzel aus 2 mal den Freiheitsgeraden minus 1) kann man einen z-Wert berechnen, der 1,68 ist. Schaut man jetzt an, welcher Fläche der z-Wert entspricht, so ist es p=0,9535. Da dies ungefähr die gleiche Fläche ist wie aus der Chi-Quadrat-Tabelle bei 30 Freiheitsgeraden kann man nun glauben, dass ab ca. 30 fg die Chi-Quadrat-Verteilung in eine Normalverteilung übergeht.

Freiheitsgrade

"Ihr einziger Parameter n muss eine natürliche Zahl sein..."

Ich muss mich momentan etwas näher mit der Chi-Quadrat-Verteilung befassen. Dabei werden auch reele Freiheitsgrade benutzt. Damit geht zwar der anschauliche Zusammenhang zur Normalverteilung verloren (mit der Faltung der Quadrate und so), aber wenn man die Verteilung als Spezialfall der Gamma-Verteilung ansieht, ist das überhaupt kein Problem. Daher scheint mir obige Aussage etwas streng zu sein. Siehe auch Wurzel-Diffusionsprozesse, hier werden Chi-Quadrat-Verteilungen mit reellen Freiheitsgrade verwendet. --Smeyen 02:20, 10. Jun 2005 (CEST)

Sagt mann nicht "Zahl der Freiheitsgrade"? Ubd was bedeutet:

(Ich weiss es, aber ein neuer Leser?130.89.218.209 21:29, 27. Nov 2005 (CET)

Gebe Dir Smeyen ganz recht und bessere das mal aus. --Thire 10:27, 19. Dez. 2006 (CET)

Wurde gerade im Artikel wieder zu "muss eine natürliche Zahl sein" geändert. Ich finde das aber gut, da z.B. die Definition genau auf diese Bedingung zurückgreift. Wenn man die Chi-Quadrat-Verteilung anders definieren kann, sollte man das explizit beschreiben und erst an der Stelle auch reelle Freiheitsgrade erlauben. --Drizzd 13:08, 28. Aug. 2009 (CEST)
In den Grafiken (cdf und pdf) wiederum werden aber nichtganzzahlige Freiheitsgrade genutzt. Das ist etwas verwirrend für den Leser, der genauer hinguckt. -- MM-Stat 19:03, 24. Sep. 2009 (CEST)

Fehler

Im Artikel steht:


  • Die Summe von unabhängigen quadrierten standardnormalverteilten Zufallsvariablen genügt einer Chi-Quadrat-Verteilung mit Freiheitsgraden.

Ich verstehe nicht wie man solche Unsinn schreiben kann.

  • Was ist Z?

Was ist Z? Steht doch da: unabhängigen quadrierten standardnormalverteilten Zufallsvariablen , oder?

@Pescador: was, wo? Quadriert? Nijdam 14:53, 11. Jul 2006 (CEST)

  • Wenn Z N(0,1)-verteilt ist, ist E(Z)=0
  • Was bedeutet σ?
  • Wenn mit σ ueblicherweise die Standartabweichung von Z oder Zi gemeint ist, gilt: σ=1.
  • Was auch immer, und nicht

Nijdam 02:58, 8. Jul 2006 (CEST)

Ich habe mal die beiden ersten Abschnitte dort gelöscht. Die Beziehung zur Normalverteilung ist ja die Definition und steht schon oben. Der zweite Abschnitt ist wirklich verquer, ich denke, da liegt ein copy-paste-fehler vor. wahrscheinlich war die Verteilung der Stichprobenvarianz gemeint. --Philipendula 00:31, 11. Jul 2006 (CEST)


??? Was bedeutet

Man schreibt:

???

Wer schreibt so etwas, und warum eigentlich??Nijdam 18:17, 18. Jun. 2008 (CEST)

Verständlichkeit

Hier ist ja schon einige Male angesprochen worden, dass der Text für jemanden, der nicht schon "bescheid weiß", unverständlich ist. Mir geht es ähnlich. Wäre nett, wenn sich jemand erbarmen würde, den Artikel zu bearbeiten, ich werde mich bei Gelegenheit auch mal damit befassen. --JazzmanPostStudent? 08:27, 15. Jun. 2009 (CEST)


Schade

Schade dass meine Änderungen alle wieder zurückesetzt sind. Ich werde versuchen der Reihe nach meine Vorschläge zu begründen.

1

Zwar ist es richtig dass im Anfang die Definition der Verteilung in Worten steht, aber mMn verdeutlicht das wenig. Es geht hier um eine Enzyklopedie und kein Mathe Lehrbuch. Deshalb habe ich stattdessen zur Verdeutlichung die Zusammenhang mit der Stichprobevarianz erwähnt. Was ist daran problematisch? Nijdam 09:00, 30. Jun. 2009 (CEST)

2

In der Tat sehr schade ist, dass die Helmertsche Transformation aus der Standardliteratur (!) sich in R nicht bestätigen lässt:

  > (H <- matrix(c(1/sqrt(2), 1/sqrt(6), 1/sqrt(3),
  +               -1/sqrt(2), 1/sqrt(6), 1/sqrt(3), 
  +                0, -1/sqrt(6), 1/sqrt(3)
  +      ), 3, 3)
  + )
            [,1]       [,2]       [,3]
  [1,] 0.7071068 -0.7071068  0.0000000
  [2,] 0.4082483  0.4082483 -0.4082483
  [3,] 0.5773503  0.5773503  0.5773503
  > 6*H^2
       [,1] [,2] [,3]
  [1,]    3    3    0
  [2,]    1    1    1
  [3,]    2    2    2
  > round(t(H) %*% H, 6)
           [,1]     [,2]     [,3]
  [1,] 1.000000 0.000000 0.166667
  [2,] 0.000000 1.000000 0.166667
  [3,] 0.166667 0.166667 0.500000
  > round(H %*% t(H), 6)
       [,1]     [,2]     [,3]
  [1,]    1 0.000000 0.000000
  [2,]    0 0.500000 0.235702
  [3,]    0 0.235702 1.000000

Natürlich macht sie nur Sinn, wenn es tatsächlich eine orthogonale Transformation ist. Man sollte hier wohl den Spektralsatz zitieren. Ggf. wird es sich sicher lohnen, die Variablentransformation zur Elimination eines Freiheitsgrades in Form einiger R-Befehle zu veranschaulichen. Gemäß H. Pruscha, "Vorlesungen über Mathematische Statistik", 2000, Teubner, Stuttgart könnte man so anfangen:

  > (ones <- matrix(1, 3, 1))
       [,1]
  [1,]    1
  [2,]    1
  [3,]    1
  > (V <- diag(3) - (ones %*% t(ones))/3)
             [,1]       [,2]       [,3]
  [1,]  0.6666667 -0.3333333 -0.3333333
  [2,] -0.3333333  0.6666667 -0.3333333
  [3,] -0.3333333 -0.3333333  0.6666667
  > round(V %*% ones, 6)
       [,1]
  [1,]    0
  [2,]    0
  [3,]    0
  > (compl <- t(t(c(0,-1,1))))
       [,1]
  [1,]    0
  [2,]   -1
  [3,]    1
  > round(V %*% compl, 6)
       [,1]
  [1,]    0
  [2,]   -1
  [3,]    1
  > (nicht signierter Beitrag von 84.160.174.241 (Diskussion) 17:36, 8. Mai 2011 (CEST)) 
die als Helmertsche Transformation bezeichnete Linearkombination ist in der Tat orthonormal, jedenfalls, wenn man sich die Mühe macht, die Koeffizientenmatrix aij korrekt, wie im Artikel beschrieben, zu erfassen. Das scheint mir im obigen Diskussionsbeitrag nicht der Fall zu sein. Die Matrix a für z.B. n=3 lautet: ((1/Sqrt(2),-1/Sqrt(2),0),(1/Sqrt(6),1/Sqrt(6),-Sqrt(2)/Sqrt(3)),(1/Sqrt(3),1/Sqrt(3),1/Sqrt(3))). Dann ist at * a =I(3). Gruss --92.228.230.70 20:00, 28. Mai 2011 (CEST)

Herleitung der Dichtefunktion: recht "physisch"

Unter Herleitung der Dichtefunktion steht: Das Integral dieser Dichte über die -dimensionale Kugeloberfläche ist die Dichte von im Punkt multipliziert mit ... Das sieht mir sehr nach Physik-Argumentation aus (Multiplikation mit dz und so). Könnte evtl. jemand, der Ahnung davon hat, im Artikel begründen, warum diese Argumentation OK ist (also: was die Voraussetzungen sind und warum sie gegeben sind), oder so eine Begründung verlinken? (Gibt's einen WP-Artikel, der erklärt, warum/unter welchen Voraussetzungen die Physik-Argumentation OK ist?) -- UKoch 16:36, 28. Sep. 2011 (CEST)

Vielleicht befriedigt folgende Formulierung die 'Mathematik' eher:

Die Dichte der Zufallsvariable , mit unabhängig und standardnormalverteilt, ergibt sich aus der gemeinsamen Dichte der Zufallsvariablen . Diese gemeinsame Dichte ist das -fache Produkt der Standardnormalverteilungsdichte:

Die Wahrscheinlichkeit, beim Würfeln eines Satzes von ein Resultat zu erhalten, dessen Quadratsumme im Intervall liegt, findet man dann mittels Aufsummieren aller Beiträge von , die die genannte Bedingung erfüllen:

.

Die Summe im Exponenten der e-Funktion bleibt während der Integration konstant, sodass die e-Funktion mit den anderen Konstanten vor das Integral gezogen werden kann. Das verbleibende Integral stellt das Volumen der Schale mit Oberfläche der n-dimensionalen Kugel und Dicke dar, wobei :

.

Mit und folglich ergibt Einsetzen die Dichte der -Verteilung:

.

Gruss, --78.48.192.161 16:50, 2. Okt. 2011 (CEST)

Helmertsche Transformation

Ich zweifle sehr daran ob die Tranformation im Abschnitt "Herleitung der Verteilung der Stichproben Varianz" tatsaechlich in der statistische Fachiteratur bekannt ist wie Helmertsche Transformation. Nijdam 10:27, 8. Okt. 2011 (CEST)

Ich habe nochmal Referenzen in der Bibliothek nachgeschlagen und neben der angegebenen noch gefunden: The Advanced Theory Of Statistics, Kendall and Stuart Vol1 4.Ed London 1977 S.267 zitiert Helmerts Transformation in diesem Zusammenhang. R.v. Mises, Mathematical Theory of Probability and Statistics, Academic Press, 1964, S.409 zitiert direkt das Originalpapier von Helmert. Helmert hat hauptsächlich in der Geodäsie gearbeitet und dort eine weitere Transformation eingeführt, die auch unter seinem Namen bekannt ist, und die in einem Wikipedia-Artikel beschrieben ist. Das Link auf diesen Artikel ist natürlich falsch, deswegen nehme ich es heraus. --78.49.78.197 22:26, 9. Okt. 2011 (CEST)

Beziehung zur Poisson-Verteilung

Dieser neue Abschnitt ist mir ziemlich unklar. Nijdam (Diskussion) 22:57, 25. Feb. 2013 (CET)

P und Q sind unvollständige auf Gamma normierte Gammafunktionen, die sich zu 1 ergänzen (Lemma Gammafunktion). 1-Q hängt auf die im Text beschriebene Weise mit der Verteilungsfunktion der Poissonverteilung zusammen, P entsprechend mit der Verteilungsfunktion der Chiquadratverteilung, so dass sich der Zusammenhang automatisch ergibt. (siehe auch engl. Version Lemma 'Poisson distribution'). Gruss --78.49.233.70 20:04, 27. Feb. 2013 (CET)


Ich kann einfach Folgendes nachpruefen.

Sei dann gilt:

,

aber welche Einsicht bringt das mir? Nijdam (Diskussion) 00:21, 28. Feb. 2013 (CET)

Es bringt mir die Einsicht, dass Poisson-Verteilung und Chi-Quadrat-Verteilung, die auf den ersten Blick nicht viel miteinander zu tun haben, über ihre Verteilungsfunktionen zusammenhängen, da beide aus den unvollständigen Gammafunktionen P und Q gebildet werden. Nichts anderes sagt der Abschnitt. Diese Beziehung drückt sich auch darin aus, dass die Näherung der Quantilsfunktionen beider Verteilungen ähnliche Form aufweisen, denn die Quantilsfunktion der Poissonverteilung ist gebildet aus der Umkehrfunktion der Gammafunktion nach dem ersten Argument (n), die der Chiquadratverteilung aus der Umkehrfunktion der Gammafunktion nach dem letzten Argument (x). Ob das darüber hinaus noch weitere Einsichten ermöglicht, weiß ich nicht. Gruss --78.49.233.70 19:29, 28. Feb. 2013 (CET)

Symbol für Freiheitsgrade

Im Einleitungssatz wird die Zahl der Freiheitsgrade als n bezeichnet. In der Abbildung rechts ist es dann plötzlich k. Im Abschnitt Definition ist k dann plötzlich der Index der zugrundeliegenden normalverteilten Zufallsvariablen. Das sollte man vielleicht angleichen. --Jazzman 10:52, 26. Jul. 2016 (CEST)

91.6.183.246 rückgängig gemacht; bitte erläutern, was das mit dem Artikelthema zu tun hat

Es handelt sich dabei um eine einfache Formel für Summen quadrierte, unabhängiger, normalverteilter Zufallsvariablen. Im Prinzip verallgemeinert es die Nichtzentrale Chi-Quadrat-Verteilung und Chi-Quadrat-Verteilung. Ich habe auf der Suche im Netz nur sehr schwer diesen Fall auffinden können, denke aber, dass sehr relevant sein kann für viele Suchende dieser Seite.

Die Frage ist halt, ob das jemand, der danach sucht, in diesem Artikel auch findet. Zumindest sollte es deutlich als Verallgemeinerung der Chi-Quadrat-Verteilung gekennzeichnet werden. Vielleicht wäre aber auch eine eigener Artikel für diese Verallgemeinerung sinnvoll, auf den man dann hier und in Normalverteilung verweisen könnte. Grüße -- HilberTraum (d, m) 19:51, 8. Dez. 2017 (CET)
Ich halte es für das beste einen eigenen Artikel zu machen, mit der Verlinkung auf diesen Artikel von der Chi-Quadrat Verteilung. Dazu müsste man dann aber etwas mehr ausholen. 'Quadratische Form von normalverteilten Zufallsvariablen'. Mal sehn, ob ich das zeitnah umsetzen kann. Grüße 91.6.183.246

Definition

Es wird dasselbe Symbol für die Chiquadratverteilung und für eine chiquadratverteilte Zufallsvariable verwendet. Dies ist unüblich und verwirrend. --Sigma^2 (Diskussion) 00:49, 3. Dez. 2018 (CET)

Hi Sigma^2. Ich habe mich da bzgl. der Notation an die angegebene Literatur gehalten; aber hast Recht, die Notation ist bestimmt nicht optimal könnte durch ein schlichtes ersetzt werden und so wird das häufig auch gemacht. Könnte man dementsprechend überarbeiten--Jonski (Diskussion) 01:10, 3. Dez. 2018 (CET)

Notation

Es ist in der Wahrscheinlichkeitstheorie und Statistik üblich, den Erwartungswert einer Zufallsvariablen und nicht einer Verteilung zu definieren und zu verwenden. Da aber z. B. E[X] nur von der Verteilung von X abhängt, spricht man auch (etwas unscharf) vom "Erwartungswert einer Verteilung". Genau genommen gibt es Parameter und Kennzahlen einer Verteilung, die z. B. den Erwartungswert einer Zufallsvariablen mit dieser Verteilung bestimmen. Auch wenn man (unscharf) vom Erwartungswert und der Varianz einer Verteilung spricht, sind Schreibweisen wie E[N(0,1)] = 1 oder Var[N(0,1)] = 1 völlig unüblich. So etwas sollt man auch nicht bei der Chi-Quadrat-Verteilung einführen. --Sigma^2 (Diskussion) 01:02, 3. Dez. 2018 (CET)

Ja sehe ich auch so. Auch hier könnte man das überarbeiten. Grüße.--Jonski (Diskussion) 01:10, 3. Dez. 2018 (CET)