Diskussion:Normalverteilung/Archiv001
invariante der FT
Die Gauß'sche Normalverteilung besitzt noch eine wichtige Eigenschaft: Sie ist eine Invariante der Fouriertransformation. Das klingt vielen sicher zu mathematisch, deshalb der Versuch einer Erklärung in einfachen Worten:
Wie vielleicht bekannt ist, kann man eine periodische Funktion durch eine Kombination von Sinus- und Cosinusfunktionen annähern oder ausdrücken. Eine Funktion, die nicht periodisch ist, kann oft durch einen Trick zerlegbar gemacht werden: Man definiert die Periode einfach zu unendlich. Wenn man sich dann vorstellt, dass man zu + unendlich geht und dann wieder bei - unendlich herauskommt, hat man die geforderte periodische Funktion. Die Normalverteilung ist eine solche Funktion: obwohl sich rechts und links sehr schnell gegen Null geht ( 1/e^x^2) wird sie doch nie Null. Macht man nun eine Fourieranalyse, so entsteht wieder eine Normalverteilung! Allerdings ist sie von inverser Standardabweichung: eine schmale Verteilung wird breit, eine breite wird schmal. Das geht so weit, dass eine unendlich schmale, unendlich hohe Normalverteilung unendlich breit wird mit dem Funktionswert 1: ein senkrechter Strich wird zu einem vertikalen Strich.(Das ist die sogenannte Diracfunktion (streng genommen keine Funktion sondern etwas besonderes)) Dieses Verhalten erlaubt es, bestimmte physikalische Erscheinungen mathematisch auszudrücken, etwa die Heisenbergsche Unschärferelation.
Wenn man sich den Dirac-Puls und sein Spektrum als Linie vorstellt, so sieht das aus, als hätte sich der Puls um 90° gedreht! In der Tat ist es so, dass nach viermaliger Anwendung der Fouriertransformation wieder das Original herauskommt.
Gelegentlich könnte man noch etwas mehr dazu sagen, vielleicht ist jemand angesprochen. RaiNa 19:02, 7. Feb 2004 (CET)
Müsste es bei der Drehung nicht 90° heißen? Ansonsten gefällt mir die Erklärung gut. --Felix Ruoff 15:01, 4. Mai 2008 (CEST)
Beispiele für Normalverteilung
Wie ist man an die Normalverteilung drangekommen? Hat man in der Natur Prozesse beobachtet, und diese Verteilung erkannt? Ist alles auf eine Normalverteilung zurückzuführen? Der IQ eines Menschen ist zum Beispiel, so habe ich es gehört, auch eine Normalverteilung. Gibt es noch mehr Beispiele? Danke, --Abdull 21:49, 6. Dez 2004 (CET)
- IQ ist vielleicht ein schlechtes Beispiel - denn der ist per Definition normalverteilt. --217.225.53.175 20:46, 12. Apr 2006 (CEST)
- Nicht ganz, nicht die Tester weisen ja nicht den Getesteten beim IQ-Test ein Ergebnis zu, so dass selbiges normalverteilt ist. Egal wie du die Punkte-Skala wählst, ein Wert wird am häufigsten vorkommen, nach links und rechts (also hohe und niedrige IQ-Werte) werden seltener vorkommen, die Werte werden einer Gaußkurve entsprechen. Was du meinst, bedeutet, dass nun die Punkteskala normiert wird, und zwar so, dass die Leute, die in der ERgebnisverteilung ein simga links oder rechts sind, den IQ 85 bzw 115 bekommen. Was du meinst, ist einfach die Normierung, dass der IQ normalverteilt ist, ist kein Phänomen, dass sich jemand mal ausgedacht hat. 19:29, 14. Nov. 2007 (CET) (nicht signierter Beitrag von 137.226.102.135 (Diskussion) 19:29, 14. Nov. 2007)
Die Gaußsche Normalverteilung wurde von Carl Friedrich Gauß entdeckt.Das denken viele!Tatsächlich hat Abraham de Moivre diese Verteilung bereits 1733 in seinem Buch "Doctrine of chances" lange vor der Geburt von Gauß als Grenzwertverteilung von normierten Binomialverteilungen erhalten. ( Satz von de Moivre-Laplace). Gauß hat nie behauptet, er habe die Verteilung entdeckt. Sie wurde aber erst durch die Arbeiten von Gauß allgemein bekannt(1809). Das Verdienst von Gauß besteht darin, daß er die Verteilung als Fehlerverteilung vorschlug und zwar zuerst in der Astronomie .Erst später in der Landvermessung.Der historisch richtige Name wäre de Moivre-Verteilung, aber der Name Gauß-Verteilung ist besonders unter Anwendern so verbreitet, dass er sich wohl kaum ändern wird. Um unvermeidbare Fehler von vermeidbaren bei der Landvermessung zu unterscheiden (letztere kann man dann zu vermeiden suchen) entwickelte er die Methode der Mittelwert und Standardabweichungsbestimmung. Zu dieser Zeit mussten ja alle Rechnungen noch manuell gemacht werden und da war so was wichtig. Immer wenn man "verrauschte" Werte hat, ist die Mittelwertbestimmung nützlich, auch bei der Sternbeobachtung usw. Aber in der doch sehr mathematischen Beschreibung dieses Artikels geht so etwas unter, dass die eigentliche Entdeckung sehr pragmatisch beeinflusst war.RaiNa 09:44, 7. Dez 2004 (CET)
- Typischerweise sind "Naturphänome" normalverteilt, beispielsweise Größe, Gewicht usw. Diese Merkmale werden von sehr vielen Komponenten beeinflusst, deren Einfluss man aber nicht mehr exakt trennen kann. Nach dem zentralen Grenzwertsatz ist die Summe dieser Einflüsse annähernd normalverteilt. Wenn man beispielsweise das Gewicht eines Schlachthähnchens betrachtet, hängt es ab von der Temperatur im Stall, von der Futtermenge, dem Stressfaktor usw, aber man kann nicht sagen, dass die Temperatur das Gewicht zu 18% bestimmt. Diese Phänomene sind natürlich nicht genau normalverteilt, sondern annähernd. Manchmal ist hier auch der Wunsch der Vater des Gedankens, etwa wenn in der Schule verlangt wird, dass Noten normalverteilt sind. Das ist großer Unsinn, zum einen, weil ja Noten rangskaliert sind, zum anderen, weil hier die Verteilung vorgegeben wird. --Philipendula 13:02, 7. Dez 2004 (CET)
Die Normalverteilung kommt durch die Wahrscheinlichkeitsverteilung zustande. Du kannst den Versuch zuhause mit 3 Würfeln ausrechnen. Aber Du kannst es auch mit 4 oder mehr Würfeln nachrechnen, aber dann hast Du viel mehr zu rechnen. Du musst folgendermaßen vorgehen. Du berechnest die Häufigkeit für eine bestimmte Augensumme bei 3 Würfeln. Zum Beispiel wäre die Häufigkeit für die Augensumme 3 nur eins, denn damit die Augensumme 3 ergibt, müssen alle 3 Würfeln eine 1 haben und diese kommt in der Warhscheinlichkeitstabelle nur einmal vor. Dafür aber kommt die 4 drei mal vor. Denn damit die Augensumme eine 4 ergibt, müssen zwei der Würfeln 1 sein und einer 2. Und das kommt in der Wahrscheinlichkeitstabelle für 3 Würfeln 3 mal vor. So kannst Du für alle Zahlen von n-mal-1 bis n-mal-6 (wobei n die Anzahl deiner Würfeln ist, bei 3 Würfeln wären das die Zahlen zwischen 3 und 18) die Häufigkeiten ausrechnen und in einem Säulendiagramm bzw. in einem Graphen eintragen. Durch diese Methode bekommst Du die ersehnte Normalverteilung oder die Gausglocke. Der Bezug zur Natur besteht nun darin, dass verschiedene Ursachen Einfluss auf ein Ereigniss haben. Um das Beispiel der IQ zu nehmen, so könnte man sagen, dass bei der Messung der IQ bestimmte Fähigkeiten aus der Fülle von Fähigkeiten auf die Probe gestellt werden. Nun verfügen die Menschen über verschiedene Fähigkeiten, die nicht alle unbedingt als Intelligenz betrachtet und/oder in einem Intelligenztest nicht zur Debatte stehen. Man würde z. B. die Fähigkeit zu flirten in einem IQ-Test messen, oder wie gut jemand Fussball spielt. Darum ist die Verteilung genauso wie bei dieser Würfelgeschichte. Dabei repräsentiert jeder Würfel eine bestimmte Fähigkeitsklasse, wie z. B. logisches Denken, kreatives Denken, sprachliches Können, emotionale Fähigkeit, usw. usf. Und die Augenzahl auf der Würfel repräsentieren Deine Fähigkeiten im jeweiligen Bereich. Nun werden beim IQ-Test einige Würfel ausgesucht und geschaut wer hat welche Augensumme. Wenn Du Glück hast, hast Du inden Bereichen, die für ein IQ-Test in Frage kommen eine hohe Augensumme und hast dann eine hohe IQ, sonst halt eine niedrige. So verhält es sich auch in vielen anderen Bereichen "der Natur". Verteilung der Körpergrößen in einer Gemeinschaft, Verteilung des Alters in einer Gemeinschaft, Verteilung von Kapital in einer Gesellschaft, Pünktlichkeit bei Terminen (sowohl für eine Person als auch in einer Gemeinschaft), Zerfall von Atomen (wobei hierbei die Gesetze noch unerforscht sind) usw. usf. --H007A 05:41, 11. Nov. 2008 (CET)
- Zumindest der Anfang deines Beitrages trifft keinen Nagel auf den Kopf. Bei deinem Beispiel handelt es sich um eine diskrete Wahrscheinlichkeitsverteilung, die in keinem Falle gleich der kontinuierlichen Normalverteilung ist, eine gewisse Annäherung liegt aber vor. Die beruht auf den Grenzwertsätzen der Wahrscheinlichkeitstheorie, die auch der Grund dafür sind, dass man die Normalverteilung in vielen Situationen als gute Näherung für die tatsächliche (meist unbekannte) Verteilung verwenden kann, siehe z.B. Zentraler Grenzwertsatz. -- Jesi 04:40, 14. Nov. 2008 (CET)
- Das Beispiel mit dem IQ halte ich aus mehreren Gründen für nicht gut. Man vermischt dabei zwei Sachverhalte. Zum einen die Konstruktion des IQ: Eine irgendwie definierte Form von Intelligenz soll in Tests gemessen werden, deren Ergebnisse auf die Gesamtpopulation gesehen einer Normalverteilung folgen sollen. Hier muss man sich darüber klar sein, dass die Normalverteilung der Ausgangspunkt war und die Definition des IQ darum herum gestrickt wurde. Zum zweiten kann man das Ergebnis eines einzelnen IQ-Tests als Zufallsvariable ansehen, wobei sich hier Messfehler auf Seiten des Tests (Test ist nicht perfekt) und auf Seiten des Probanden (z.B. Tagesform) vermischen. Ich würde als Beispiel lieber etwas nehmen, wo man nur eine Art von Fehler berücksichtigen muss, etwa eine zufällige Größe, die man genau messen kann oder eine unbekannte, aber real existierende Größe, bei der es einen Messfehler gibt. --Knollebuur 11:42, 14. Nov. 2008 (CET)
todo
Was noch fehlt
Imho ist die Standardnormalverteilung noch stark verbesserungswürdig. So fehlen noch Streubereich, Antistreubereich, linker und rechter Spitz, Negativitätsregel. Ich werde das bei Gelegenheit noch erweitern. Tom1200 14:56, 26. Mai 2005 (CEST)
- Nach den jüngsten Aktualisierungen wären Graphiken unbeding nötig - mal sehen was sich machen lässt. Außerdem wäre noch die Approximation der Biniomialverteilung durch die NV mit Stetigkeitskorrektur nett. Aber ich warte erst ab, wie die neuen Kapitel aufgenommen werden. Tom1200 23:06, 28. Mai 2005 (CEST)
Was noch fehlt 2
Auf dieser Seite wird die normierte Gaußfunktion beschrieben. Häufig benötigt man die Gaußfunktion jedoch um sie z.B. über ein Balkendiagramm zu legen und so zu beweisen, dass die Verteilung normalverteilt ist. Für solche Zwecke benötigt man die nicht normierte Gausfunktion, die als Absolutwerte die Anzahl der Versuche in der Verteilung wiedergibt. Die Formel dafür hatte ich nich mehr im Kopf, weswegen ich gegoogelt habe. Bisher ohne Erfolg.
Ich glaube aber, dass man dann die Gaußfunktion nur mit n=Anzahl der Versuche multiplizieren muss. Dies könnte noch erwähnt werden.
- Ich bin etwas verwirrt, weil ich nicht verstehe, was für Balkendiagramme Du meint. Wenn Du eine empirische Verteilung auf eine Normalverteilunsannahme testen willst, kannst Du den Kolmogorow-Smirnow-Test verwenden. Der ist aber nicht auf Normalverteilungen beschränkt.
- Es könnte aber auch sein, dass Du gerade an Bernulli- und Binomialverteilungen denkst. Wenn nicht, müsstest Du Dich etwas klarer ausdrücken, was Du meinst. --Smeyen | Disk 20:14, 29. Mai 2006 (CEST)
- Ich verstehe die Frage so, dass man in einer empirischen Messung Werte mit einem Mittelwert m und einer Standardabweichung s hat, und wenn man die Messwerte nach Häufigkeit plottet, könnte man die Normalverteilung der Werte veranschaulichen, wenn man eine Normalverteilung (Gaußfunktion) mit den entsprechenden Parametern m und s, nicht die Standardnormalverteilung (normierte Gaußfunktion, , ) dahinterlegt. Ich wünsche mir hier auch ein Bild der Normalverteilung mit der Achsenbeschriftung , , etc. --(Sorry, kein login)--
Mit Balkendiagrammen sind wahrscheinlich Histogramme gemeint. Um eine Dichtefunktion (pdf) an ein Histogramm anzupassen multipliziert man die pdf mit der Klassenbreite des Histogrammes - ergibt die ungefähre Wahrscheinlichkeit dass ein Sample in diese Klasse fällt - und mit der Anzahl der Samples - gibt den Erwartungswert für die Anzahl der Samples in der jeweiligen Histogrammklasse. (Rudloff) (nicht signierter Beitrag von 193.171.83.181 (Diskussion) 16:11, 24. Apr 2008)
Wahrscheinlichkeitsrechnung
Gilt eigentlich der zur Standardisierung von normalverteilten Zufallsvariablen genutzte Zusammenhang: nur für die Normalverteilung?
- Du kannst alle Wahrscheinlichkeitsfunktionen über Variablentransformation transformieren, aber standarisieren kannst Du damit nur Wahrscheinlichkeitsverteilungen, die über ihren Erwartungswert und ihre Varianz bestimmt sind. Außer der Normalverteilung fällt mir da nur die Students t-Verteilung ein. Die Exponentialverteilung wird dagegen über die Rate parametrisiert, da erreichst Du durch obige Transformation keine Standarisierung mehr.
Und: Für die Normalverteilung gilt auch allgemeiner, wenn :
Gibt es bestimmte Bedingungen, dass dieser allgemeinere Fall gilt, die weniger restriktiv sind als die Annahme der Normalverteilung von X?
- Nein, das ist falsch, da die letzte Gleichung nicht gilt. Es müsste heißen:
- Das funktioniert dann auch bei allen Wahrscheinlichkeitsverteilungen, nur kommst Du dadurch nicht au eine wie auch immer geartete Standardform. Beachte, dass dann die transformierte Zufallsvariable nicht mehr unbedingt der selben Klasse von Wahrscheilichkeitsfunktionen angehören muss: Wenn X exponentialverteilt ist, dann ist X auch exponentialverteilt, 2X+1 aber nicht mehr.
Danke! und Sorry für den Fehler und danke für's Ausbessern! Aber genau das wollte ich wissen - es ging nicht um standardisieren, sondern um die Anwendbarkeit der Variablentransformation (hätte ich diesen Begriff gekannt, wäre es einfacher gewesen was zu finden...). auch für den Hinweis zur t-Verteilung und zum Unterschreiben vielen Dank. --195.143.211.20 19:09, 5. Aug 2005 (CEST)
Und wo kann man die (verständlich) nachlesen?
(man kann diesen allgemeineren Fall einfach herleiten: er basiert auf der Eigenschaft der Normalverteilung, dass eine durch lineare Transformation einer normalverteilten Zufallsvariable erzeugte Zufallsvariable ebenfalls normalverteilt ist (vgl. z.B. Poddig, Dichtl, Petersmeier, "Statistik, Ökonometrie, Optimierung", 2. Aufl. (2001) ("PDP") S. 76) sowie den Rechenregeln für Erwartungswert und Varianz. Durch Standardisierung die Wahrscheinlichkeit für y1<Y<y2 angeben und umformen).
Irgendwie kommt es mir so vor, als ob sich die Werte von Wahrscheinlichkeitsfunktionen (kumulierte Dichtefunktionen, cdf) grundsätzlich durch lineare Transformationen der Zuvallsvariablen nicht ändern... auch intuitiv plausibel, Beispiel: Würfeln und jede gewürfelte Zahl X durch 2 teilen und dann die Zahl 1 addieren, so dass Y=X/2 + 1 dann gilt doch z.B. P(X<3) = P(Y<3) und P(X>1) = P (Y > 1/2 + 1)
- Doch, die Wahrscheinlichkeit ändert sich: P(X<4)=3/6=1/2, P(Y<4)=5/6.
- leider wieder der gleiche Fehler - nochmal sorry - es muss heißen: P(X<3) = P(Y<2,5) und P(X>1) = P (Y > 1,5) - ist auch bei Deinem - entsprechend geänderten Beispiel so: P(X<4 = 3/6)= P(Y<3)=3/6
--195.143.211.20 19:09, 5. Aug 2005 (CEST)
Auch basiert z.B. offenbar die Herleitung der Ermittlung von Konfidenzintervallen mit der t-Verteilung offenbar auf linearen Transformationen ohne Änderung von Wahrscheinlichkeiten... (vgl. PDP, S. 186)...
- Siehe oben. Die t-Verteilung ist die einzige, mit der es sonst noch funktioniert (also die einzige, die ich kenne).
Viele Grüße,
Verteilungsfunktion --> Wahrscheinlichkeitsverteilung
Hier in dem Artikel wird für F(x) der Begriff "Verteilungsfunktion" während bei der Exponentialverteilung der Begriff "Kumulierte Verteilungsfunktion" verwendet wird. Wäre es nicht sinnvoller man würde konsequent den Begriff "Wahrscheinlichkeitsverteilung", auf den auch die beiden Begriffe weitergeleitet werden verwenden?. 17:20, 11. Aug 2005 (CEST)
- ist keine Verteilung, sondern eine Verteilungsfunktion, deswegen die Begriffe nicht abwechselnd verwenden. Eine Verteilungsfunktion ist eine maßdefinierende Funktion, die das Maß der Wahrscheinlichkeitsverteilung bestimmt. Das "kummulierte" kannst Du, wenn Du magst, streichen.--Smeyen Disk 11:45, 12. Aug 2005 (CEST)
Definition
In der obersten Intro steht eine saubere Definition der NV. Unter dem Kapitel Definition dagegen eine m.E. falsche; z.B. ist die Forderung der Stetigkeit der ZV, die normalverteilt sein soll, unsinnig.--JFKCom 11:33, 23. Aug 2005 (CEST)
Summe von normalverteilten Zufallsvariablen
Hat jemand Lust den Beweis zu schreiben, dass die Summe von zwei normalverteilten ZV wieder normalverteilt ist?
- Ist die Frage, ob der Beweis so elementar ist, dass er hier aufgeführt werden müsste. Schließlich ist das hier eine Enzyklopädie und keine Mathematiklehrbuch, da kommt es eher auf Verständlichkeit an als darauf, alles beweisen zu müssen. Aber meines Wissens ist der Beweis ein Dreizeiler (eine einfache Faltung (Mathematik)). --Smeyen | Disk 14:25, 23. Mär 2006 (CET)
Ein Literaturverweis wäre sinnvoller meines Erachtens. --Methossant 20:57, 27. Jun. 2008 (CEST)
- Es geht aber auch einfacher: Die charakteristische Funktion einer nornalverteilten Zufallsvariablen ist . Die ch. F. der Summe unabhängiger Zv. ist das Produkt der beiden ch. F. (siehe charakteristische Funktion (Stochastik)#Eigenschaften, letzter Eintrag) und damit , und das ist wieder die ch. F. einer normalverteilten Zv. Für nicht unabhängige Zv. gilt dieser Summensatz sowieso nicht. -- Jesi 05:13, 29. Jun. 2008 (CEST)
Halbwertsbreite
Vielleicht könnte man in den Artikel noch reinschreiben, wie man von der Standardabweichung auf die Halbwertsbreite der Gauß-Kurve kommt....??
Ja....das wollte ich ja auch gerne wissen. Na FWHM (=full width at half maximum), also die Breite der Kurve in der Höhe des halben Maximums. Physiker brauchen sowas manchmal/öfters. Habe jetzt durch Google rausgefunden, dass
FWHM = sigma * sqrt(8 ln 2)
ist. Vielleicht kann man das noch mit reinschreiben? Aber ich dachte halt, Mathematiker wissen das sicherlich besser als ich.
- Also ich studiere Physik im fünften Semester und hab das bislang noch nie gebraucht, kann mich zumindest nich dran erinnern ;). Das sigma is da schon das wichtigste 19:40, 14. Nov. 2007 (CET) (nicht signierter Beitrag von 137.226.102.135 (Diskussion) 19:40, 14. Nov. 2007)
- Das ist schon was wichtiges. Ich brauch's in der Spektroskopie andauernd. Aber nicht nur die FWHM sind wichtig, sondern auch der x-Wert bei dem die Verteilung auf 1/e bzw. 1/e^2 des Maximums gefallen ist.
- Leider hab ich's grad überhaupt net zur Hand.
- Bei Gelegenheit schreib ich's rein. (nicht signierter Beitrag von 147.142.186.54 (Diskussion) 18:13, 20. Nov. 2007)
Zwölferregel
- "Für numerische Simulationen ist die Zwölferregel daher sehr bedenklich! Andere genauso leicht zu programmierende Verfahren sind unbedingt vorzuziehen!"
stand im abschnitt zur zwoelferregel. ich habe das auskommentiert und frage hier, ob es ueberhaupt relevant ist, das zu erwaehnen (quellen?) und falls ja, ob das jemand gescheiter formulieren koennte. -- 141.3.74.36 17:05, 13. Okt. 2006 (CEST)
- Wenn die Aussage zutrifft, dann ist sie sehr relevant. Wer dies nicht weiß, der neigt dazu, eine normalverteilte Zufallsvariable durch die Addition von gleichverteilten Variablen zu erzeugen. Dies erscheint aufgrund des zentralen Grenzwertsates naheliegend, ist der Aussage nach aber äußerst problmenatisch. Ich habe weiterhin den Eindruck, dass dies nicht Laien zutrifft. Zufallszahlen muss man für praktisch jede Simulation generieren und diese sind oft normalverteilt. Die Aussage ist somit u. a. für die wissenschaftliche Praxis von entscheidender Bedeutung. Ich plädiere für eine neutrale Schlussfolgerung für Praxis, z. B. "Auf die Zwölferregel sollte daher nur dann zurückgegriffen werden, wenn die Unabhängigkeit der gleichverteilten Zufallsvariablen gewährleistet ist." Falk Lieder 20:55, 13. Okt. 2006 (CEST)
- Die Zwölferregel ist dann problematisch, wenn die gleichverteilten Zufallsvariablen nicht ganz unabhängig sind. Beim Kongruenzgenerator kann das schon mal der Fall sein. Der springende Punkt ist, dass sie anderen Verfahren deutlich unterlegen ist. Andere Verfahren brauchen ein bis zwei gleichverteilte ZV, um eine normalverteilte zu erstellen, bei der Zwölferregel braucht man eben zwölf. Das Verfahren ist also deutlich langsamer. Meines Wissens braucht man die Zwölferregel eher aus pädagogischen Gründen, um den zentralen Grenzwertsatz erklären zu können. --Smeyen | Disk 20:01, 16. Okt. 2006 (CEST)
- Selbst aus pädagogischen Gründen ist es nicht ratsam, ein Gesetz das beim Grenzübergang der Anzahl unabhängiger identisch verteilter Zufallsvariablen gegen unendlich gilt bei nur 12 Zufallsvariablen als gegeben anzunehmen. Diese Methode der Simulation ist bestenfalls einfach zu kodieren, es gibt eine sparsamere und interessantere Alternative in Form der Box-Mueller-Transformation. Eine Simulation der Standardnormalverteilung die nur Werte zwischen -6 und 6 liefern kann lässt den unbeschränkten Träger völlig unter den Tisch fallen. kw 11:47, 17. Okt. 2006 (CEST)
- Ich habe eine Quelle im Kommentar angegeben. Knuth vol 2 S. 106. Die numerical recipes tuns auch. Der Spektraltest liefert dieses Ergebnis. Und was heißt gescheiter formulieren? Die Aussage ist einfach korrekt. Mathematisch beweisbar. Und bewiesen. Die oben genannten Zusatzaussagen verstärken das. Auch Pädagogik ist kein Argument für die Zwölferregel. Man sieht leider in der Praxis immer wieder Programme, die die Zwölferregel anwenden, weil man bei BOX-Mueller mehr denken müsste! --Brf 13:47, 17. Okt. 2006 (CEST)
- Für die meißten Zwecke würden 12 gv-Zufallszahlen wohl ausreichen, der Wertebereich ist (für einer Simulation) groß genug. Man wählt Zwölf wohl deshalb, weil dann die Varianz der Summe eben 1 ist. Aber in der Praxis ist das wirklich ein eher sinnloses Simulationsverfahren. Es ist wohl eher ein Beispiel für den zentralen Grenzwertsatz als für die Erzeugung von Zufallszahlen. --Smeyen | Disk 18:17, 17. Okt. 2006 (CEST)
Polarmethode und Verwerfungsmethode
Wo wir beim Simulieren sind: im Artikel wird die Polarmethode vorgestellt und eine Verwerfungsmethode erwähnt. Die Polarmethode ist eine Verwerfungsmethode (mit Verwerfungen wird eine über den Einheitskreis gleichmäßig verteilte Zufallszahl erzeugt), weitere (gängige) Verwerfungsmethoden sind mir nicht bekannt. Wenn es noch welche gibt, wäre es interessant zu wissen, welche Vorschlagsfunktion man verwendet. --Smeyen | Disk 18:23, 17. Okt. 2006 (CEST)
Rechnen mit der Standardnormalverteilung
Wäre es vorteilhaft, die Beziehung zur Cauchy-Verteilung im Abschnitt "Rechnen mit der Standardnormalverteilung" einzureihen und um die allgemeine Lösung für beliebige Varianzen zu erweitern (siehe etwa die englische Version der Seite)?
Weiterhin frage ich mich, ob in der Wikipedia die aus einer Division zweier Normalverteilungen mit unterschiedlichen Erwartungswerten resultierende Wahrscheinlichkeitsverteilung (die unimodal oder bimodal sein kann) samt der analytischen Loesung erwähnenswert ist.
- Ich weiß nicht, was die Cauchy-Verteilung im Umgang mit der Normalverteilung helfen soll, zumal sie doch gar kein zweites Moment besitzt. Ansonsten finde ich die momentane Lösung (Transformation einer normalverteilten in eine standardnormalverteilte Variable) eigentlich die einfachste.
- Was die Division zweier Normalverteilungen angeht: Abschnitt 3.3 behandelt ja genau das Thema. Man könnte diesen ausführlicher fassen, Beweise oder Beweisskizzen gehen aber gewöhnlich zu weit. --Smeyen | Disk 15:16, 25. Okt. 2006 (CEST)
- Der Abschnitt "Rechnen mit..." befaßt sich nicht - wie von mir zunächst erwartet - mit Berechnungen, die normalverteilte Zufallsvariablen enthalten. Ich hätte hier Aussagen und Vorschriften zu Rechenoperationen wie a+X, a*X, X+Y, X*Y, X/Y,... ; a ∈ ℜ; X,Y~N(0,1) vermutet. Eine zusammenfassende Übersicht hierzu würde meiner Ansicht nach die (insgesamt sehr verwirrend gestaltete) Seite verbessern. Die englische Version beinhaltet dies etwa im ersten Abschnitt von "Properties":
- http://en.wikipedia.org/wiki/Gaussian_Distribution#Properties
- Bezüglich der Division zweier Normalverteilungen sähe ich es als wichtig an zu erwähnen, daß X/Y; X,Y~N(μ,σ) nur einer Cauchy-Verteilung entspricht, falls μ=0. Etwa im Falle (a+X)/(b+Y); a,b ∈ ℜ+; X,Y~N(0,1) ergibt sich eine recht komplexe Verteilung, die bimodal ist, wenn a>2,257. Ansonsten kann sie unimodal oder bimodal sein. Dies ist insbesondere wichtig, da dieser Zusammenhang aus der Taylor-Entwicklung nicht direkt offensichtlich wird. Ein entsprechender Zusammenhang kann in experimentellen Ergebnissen leicht fehlinterpretiert werden, wenn eine unimodale Verteilung erwartet wird, so daß die Erwähnung in der Wikipedia relevant wäre. (Analytische Lösung hierzu: Marsaglia, G.: Ratios of Normal Variables and Ratios of Sums of Uniform Variables. In: Journal of the American Statistical Association, Vol.60/309, 1965, S. 193-204).
Warum Approximation der Binomialverteilung
Gibt es einen guten Grund, die Approximation der Binomialverteilung als eine spezielle Anwendung des zentralen Grenzwertsatzes so herauszuheben? Die Verteilung der Summe von unabhängingen, identisch verteilten Zufallsgrößen konvergiert mit wachsender Zahl der Summanden in Verteilung gegen eine Normalverteilung mit der Summe der Erwartungswerte als Erwartungswert und der Summe der Varianzen als Varianz. Die Konvergenz der Binomialverteilung als Summe von Bernoulli-verteilten Zufallsgrößen ist ein Spezialfall dieses allgemeineren Gesetzes. Eine Aussage zur Normalapproximation der Binomialverteilung gehört eher zur Binomialverteilung als zur Normalverteilung. kw 16:26, 15. Nov. 2006 (CET)
- Ich glaube, weil es das einfachste Beispiel ist. Nichtmathematiker lernen Mathematik bevorzugt durch Beispiele (kann man jetzt gut oder schlecht finden, ist aber so), und die Binomialverteilung ist wohl das griffigste, Zumal sie ja selbst schon eine Faltung ist. Man hätte vielleicht auch ein anderes Beispiel nehmen können, aber Hauptsache, es gibt überhaupt eins. --Smeyen | Disk 18:25, 15. Nov. 2006 (CET)
- Es erschien mir als ein erhaltenswerter Teil in dem von mir gelöschten Abschnitt, der zwar nichts mit der Normalverteilung als Approximation für die Binomialverteilung zu tun hat, aber trotzdem erhalten bleiben soll. Immerhin liefert er etwas zum Entdeckungszusammenhang. Nachdem aber die Approximation der Binomialverteilung durch die Normalverteilung so wichtig zu sein scheint, entferne ich den Teil wieder aus der Einleitung kw 07:33, 16. Nov. 2006 (CET)
zu schwer
mir hat das thema schonmal jemand so erklärt das ich es verstanden hab. hier seh ich nicht durch--88.72.238.74 12:41, 12. Dez. 2006 (CET)
- Eine interessante Rückfrage wäre, welches Thema da eigentlich verständlich erklärt wurde. Der Artikel ist eine Sammlung von Fakten, und vieleicht nicht einmal von ausgewählten wichtigen Fakten, über die Normalverteilung. Die Normalverteilung ist sicher kein Thema, das so abgegrenzt werden kann, dass es abschliessend erklärbar ist. Spätestens ab "In der Versicherungsmathematik" wird der Artikel aber dann fragwürdig, obwohl das, was da steht, jeweils für sich genommen nicht falsch ist. Einige Punkte zum Nachdenken:
- wem die Definition über die Dichte etwas sagt, der kennt die Dichte der Normalverteilung ohnehin. Die Dichte zu erwähnen ist damit nicht schlecht, aber die Einführung als Grenzverteilung aus dem zentralen Grenzwertsatz in Worten (und ohne "konvergiert in Verteilung" einfach nur so hinzuschreiben) ist sicher nützlicher und steht schon in diesem Artikel.
- über die Verteilungsfunktion würde es doch genügen zu sagen, dass keine geschlossene Darstellung existiert. Wer den Zusammenhang zwischen Dichte und Verteilungsfunktion kennt, kann dann die Darstellung im Artikel selbst hinschreiben, und dieser Zusammenhang ist keine spezielle Eigenschaft der Normalverteilung. Einem anderen würde ein Hinweis auf eine allgemeinere Darstellung bei den stetigen Verteilungen wohl die gleiche Information bieten.
- was symmetrisch um den Erwartungswert für die Funktionsgraphen von Dichte und Verteilungsfunktion bedeuten, nämlich Achsensymmetrie für die Dichte und Punktsymmetrie für die Verteilungsfunktion muss nicht unbedingt in Formeln dargestellt sein, jedenfalls nicht in einem Artikel über die Normalverteilung. Entsprechende Darstellungen über die Symmetrie von Funktionen enthält schon der Artikel über Symmetrie in der Geometrie, und dieses Medium bietet doch die Möglichkeit, einen Verweis einzufügen (für den Autor) oder einem Verweis nachzugehen (für den Leser). Die Symmetrieeigenschaften der Funktionsgraphen der Dichte oder der Verteilungsfunktion der Normalverteilung unterscheiden sich ja nicht von denen anderer Funktionsgraphen.
- welche Bedeutung der verirrten Stichprobenvarianz unter der Überschrift Entropie zukommen mag übersteigt mein Einsichtsvermögen.
- Handwerkliche Anleitungen zur Integration einer Funktion einer veränderlichen bietet zu Recht der Artikel Integralrechnung. Die Integration durch Substitition ist dort formal dargestellt und könnte sicher durch ein Beispiel wie das im diesem Artikel vorgeführte illustriert werden. Aber würde in einem Artikel über die Normalverteilung nicht ein Hinweis auf die Integration durch Substitution ausreichen ohne dass diese hier handwerklich vorgeführt wird?
- dass die Approximation der Binomialverteilung ein wesentliches Anwendungsbeispiel ist haben wir ja schon diskutiert. Auch die didaktische Vorgehensweise vom speziellen Beispiel zur allgemeineren Darstellung ist mir bekannt. Aber das spezielle Beispiel alleine, ohne einen Verweis auf das dahinterstehene allgemeinere Prinzip in die Welt zu stellen ist noch nicht einmal ein guten didaktischer Ansatz. Aus dem Artikel in seiner jetzigen Form lerne ich, dass es eine spezielle Beziehung der Normalverteilung zur Binomialverteilung gibt, die eine Approximation der Binomialverteilung durch die Normalverteilung ermöglicht. Aus dem Artikel lerne ich weiterhin, dass andere Verteilungen mit existierendem Erwartungswert und existierender Varianz wohl nicht durch die Normalverteilung approximiert werden können, weil eine solche allgemeinere Anwendung ja sonst irgendeine Erwähnung finden würde. Wie sich der arme Max Planck mit seinem Energiequantum in die Darstellung der Approximation der Binomialverteilung mit Hilfe der Normalverteilung verirrt hat, und ob es für diese Darstellung nicht irgendwo in dieser Enzyklopädie einen lohneneren Ort geben könnte, ist auch eine offene Frage.
- in den Darstellungen zum Rechnen mit der Standardnormalverteilung finde ich vieles, was für alle stetigen Verteilungen gilt, manches, was für symmetrische stetige Verteilungen gilt, und einiges, was für um die 0 symmetrische stetige Verteilungen gilt. Die Normalverteilung ist eine um 0 symmetrische stetige Verteilung, aber eben nicht die einzige Verteilung mit diesen Eigenschaften. Gilt den die Negativitätsregel nicht auf für die t-Verteilung, relativ unabhänig von deren gewähltem Parameter? Ein netter Artikel zum Rechnen mit stetigen Verteilungen, der die Spezialfälle behandelt läßt sich recht einfach aus dem unfangreichen Artikel extrahieren, und dieses Medium bietet die einfache Möglichkeit, diese allgemeinere Betrachtung für den interessierten Leser aus diesem Artikel zugänglich zu machen. kw
- Der Artikel fristet schon lange ein Mauerblümchendasein bei verminderter Qualität, was bei der Bedeutung der Normalverteilung etwas schade und überraschend ist. Dass Du mal die Finger auf die Wunden legst, wäre vielleicht ein guter Einstieg, um den Artikel mal aufzuräumen. Aber unterschreibe bitte das nächste mal Deine Diskussionsbeiträge.
- Mit mathematischen Themen ist das so eine Sache mit der Verständlichkeit, die lassen sich teilweise nicht so einfach erklären, wie man sich das vorstellt, weil es sich um eine sehr komplexe Materie handelt. Wenn man nicht weiß, was eine Zufallsvariable ist (sie ist weder zufällig noch variabel), macht der Artikel in dieser Form tatsächlich wenig Sinn. Natürlich könnte ich jedem Abiturienten begreiflich machen, was eine Normalverteilung ist, nur bräuchte ich mehrere Stunden Zeit, ihm die Grundlagen der Wahrscheinlichkeitstheorie zu erklären. Die haben wir in einem Artikel aber nicht. Das mit dem Oma-Test ist also ein frommer Wunsch. Das heißt aber nicht, dass der Artikel nicht über das jetzige Niveau kommen könnte. Ich versuche mal auf Deine Punkte einzugehen:
- Die Dichte der Verteilung ist die Größe, über die die Verteilung definiert wird und damit der zentrale Punkt des Artikels, der in die Einleitung muss. Verteilungen werden normalerweise durch ihre Verteilungs- oder Dichtefunktion definiert. Der zentrale Grenzwertsatz ist eine wichtige Eigenschaft, aber sicher nicht wichtiger als die Dichtefunktion. Ich kannte die Dichtefunktion übrigens Jahrelang nicht auswendig, sondern musste auf dem 10-DM-Schein nachschauen - insbesonders für die Normierungskonstanten.
- Über die Verteilungsfunktion müsste man erwähnen, dass sie nicht geschlossen darstellbar ist, jedoch Funktionen in Tabellenkalkulationen und mathematischer Software existieren. Dabei zu erwähnen, dass die Verteilungsfunktion das Integral der Dichtefunktion ist, halte ich nicht für übertrieben, auch wenn das anderswo nochmal steht. Ein wenig Redundanz schadet der Wikipedia nicht. Außerdem muss man auf die tabellierte Verteilungsfunktion der Standardnormalverteilung eingehen und damit notgedrungen auf die Symmetrieeigenschaft der Normalverteilung und die Transformation einer normalverteilten in eine standardnormalverteilte Variable. Da mag zwar vieles für symmetrische Variablen allgemein gelten, aber wie gesagt, Redundanz ist nicht unser größter Feind. Wenn Du meinst, das könne man kürzer und weniger mathematisch-formal machen, gebe ich Dir durchaus recht.
- Stichprobenvarianz bei der Entropie ist wohl ein Vertipper.
- Den Zusammenhang mit der Binomialverteilung finde ich nicht so schlimm, obwohl ich auch auf ihn verzichten könnte. Welche Verteilung wird denn sonst noch so durch Normalverteilungen approximiert (außer 12 Gleichverteilungen)? Aber vielleicht sollte man den Absatz wirklich erst mal löschen.
- Was Max Planck hier verloren hat, verstehe ich auch nicht, genau so wenig wie den unmotivierten Link auf die Versicherungsmathematik.
- Das was Du als schnöde Aneinanderreihung von Fakten abzutuen scheinst, halte ich übrigens für sehr nützlich: ich muss öffters mal einzele Sachen nachschauen (Momente, charakteristische Funktion, Beziehung zu anderen Verteilungen). Das würde ich auch im Taschenbuch der Statistik finden, aber Wikipedia ist halt schneller. --Smeyen | Disk 20:15, 14. Dez. 2006 (CET)
- Den Link zur Versicherungsmathematik finde natürlich nicht ganz unmotiviert , aber trotzdem sehr entbehrlich, weil auch in der Versicherungsmathematik eigentlich nur noch historisch oder für einen Versicherungsmathematiker interessant, der nur mit einer Tafel der Normalverteilung auf einer einsamen Insel strandet und dort statt Kokosnüsse zu ernten lieber eine Sachversicherung für kleine bis mittlere Schäden aufziehen möchte.
- Zur Definition einer stetigen Verteilung über ihre Dichtefunktion: Natürlich wird eine Verteilung über die Dichte definiert, und in einem Lehrbuch der Stochastik soll eine Verteilung auch genau so eingeführt werden. Außerhalb eines solchen Lehrbuches ist aber die Frage, was den eigentlich normalverteilt ist, oder sogar eine Darstellung, warum eine nur theoretisch existierende Grenzverteilung so grosse praktische Relevanz hat vieleicht nützlicher als die formale Definition. So eine Art Abramowitz/Bronstein-Wiki würde möglicherweise helfen, den Formelsammlungscharakter der Enzyklopädie-Artikel zu reduzieren
- Verteilungen mit existierendem Erwartungswert und existierender Varianz haben oft eine Entwicklungsrichtung, in der eine Approximation über eine Normalverteilung brauchbar ist. Das gilt neben den offensichtlichen Fällen wie der Chi-Quadrat-Verteilung (und anderer Gamma-Verteilungen) beispielsweise auch für dieF-Verteilung und die Verteilung verschiedener Rangsummen aus der nicht-parametrischen Statistik. Auch Beta-Verteilungen haben mit wachsender Summe der Parameter einen grossen Bereich, in dem eine Approximation der Verteilung durch eine Normalverteilung mit dem Erwartungswert und der Varianz der Beta-Verteilung brauchbar ist, ehe die Verteilung zu einer Ein-Punkt-Verteilung degeneriert. Dass auf die Anwendung der t-Verteilung bei hinreichend grossem Stichprobenumfang verzichtet werden kann ist auch kein besonderes Gesetz sondern in der guten Approximation der t-Verteilung durch eine Normalverteilung begründet. Mir geht es gerade umgekehrt: Mir fällt ausser der Exponentialverteilung keine gebräuchliche univariate Verteilung mit existierendem Erwartungswert und existierender Varianz ein, für die es keine wenigstens bereichsweise brauchbare Normalapproximation gibt. Selbst die aus der Exponentialverteilung abgeleiteten Lebensdauerverteilungen wie die Erlang-Verteilung, die Hjorth-Verteilung oder die Weibull-Verteilung sind bereichsweise gut mit einer Normalverteilung approximierbar. kw 19:43, 15. Dez. 2006 (CET)
- Ich hoffe, ich habe am Wochenende Zeit, mal darauf einzugehen, und möchte hier nur das Wichtigste vornewegschicken.
- Ein eigenes Mathewiki wäre schön. Nicht nur, weil man dann Artikel über Wahrscheinlichkeitsverteilungen viel mathematischer und formaler aufziehen könnte, sondern auch zu jedem noch so absonderlichen (sprich: hier irrelevanten) Satz ein eigenes Lemma anlegen kann und ohne Rücksicht auf Verluste Beweise reinschreiben könnte. Leider gibt es so was (noch) nicht. Trotzdem würde ich die Dichtefunktion gleich vornewegschicken, oder, wie es jetzt ist, in den ersten Abschnitt stecken. Dass im zweiten Absatz ein Abschnitt über die einzelnen Parameter der Verteilung kommt, ist wohl deshalb sinnvoll, weil andere Artikel über W'Verteilungen auch so aufgebaut zu sein scheinen.
- In einem dritten Abschnitt könnte man auf die Bedeutung des ZGS eingehen, und da die Verteilungen, die man gerne mal mit der Normalverteilung approximiert, kurz erwähnen.
- In einem vierten Abschnitt wird die Beziehung zu anderen Verteilungen erwähnt (im Wesentlichen deshalb, weil das in anderen Artikeln auch so gemacht wird). Dort werden die Verteilungen, die nur approximiert werden, nicht mehr erwähnt. Absatz drei und vier kann man auch tauschen.
- Ganz um das Thema „Wie rechne ich mit der tabellierten Verteilungsfunktion?“ werden wir wohl nicht herumkommen, auch wenn man den Abschnitt kürzer und klarer fassen sollte.
- --Smeyen | Disk 22:18, 15. Dez. 2006 (CET)
- Ich hoffe, ich habe am Wochenende Zeit, mal darauf einzugehen, und möchte hier nur das Wichtigste vornewegschicken.
Literaturquelle Quotient standardnormalverteilter ZV = Cauchy-verteilt
Hallo liebe Wiki-Autoren!
Da ich mich gerade mit dem Problem der Verteilung von Produkten und Quotienten normalverteilter ZV beschäftige, bin ich brennend daran interessiert, in welcher Quelle man etwas hierzu findet.
Viele Grüße!
PS: Hat jemand auch zufällig eine Verteilung für das Produkt normalverteilter ZV im Angebot?
- Horst Rinne: Taschenbuch der Statistik, Verlag Harri Deutsch, 3. Auflage 2003. Kapitel B3.10, Seite 299. Das ist ein schönes Nachschlagewerk, so was wie ein Bronstein für Stochastiker, das ich ganz nützlich finde. Der Quotient ist die erwähnte Cauchy-Verteilung, für das Produkt wird die Dichtefunktion
- angegeben, aber das scheint keine geläufige Verteilung (kein must-know) zu sein. --Smeyen | Disk 02:19, 6. Feb. 2007 (CET)
Abschnitt Allgemeines
überarbeiten
Bitte überarbeiten. Das stimmt so überhaupt nicht wie es da drin steht bzw. ist sehr missverständlich und häufig eine Fehlerursache für Blödsinn in wissenschaftlichen Arbeiten. Beispiel: Binomialverteilung - Kann approximativ eine Normalverteilung werden, aber das dauert EWIG. Deswegen ist es im Allgemeinen falsch einer Binomialverteilung eine Normalverteilung zu unterstellen, weil dies bei den gegeben Daten einfach nie passieren wird. Bitte unbedint den Absatz noch ändern, denn erfahrungsgemäß pflanzen sich solche Missverständnisse sehr gerne sehr schnell fort. Korrekturleser1st 17:58, 4. Jun. 2007 (CEST)
- Ich finde den Abschnitt auch nicht gelungen. Ich habe nicht verstanden, was Max Planck in diesem Artikel zu suchen hat und würde den Absatz ganz löschen. Was der Künstler mir mit den Würfelversuchen überhaupt sagen wollte, habe ich auch nicht verstanden, aber es gehört ganz bestimmt nicht in diesen Artikel. Lediglich den Zentralen Grenzwertsatz halte ich für so wichtig, dass er unbedingt erwähnt werden muss, und damit auch die Approximation durch die Binomialverteilung (selbstverständlich gilt der ZGS auch für die Bernulli-Verteilung. Warum Dir diese Approximation zu ungenau ist, kann ich nicht nachvollziehen.). Allerdings käme die Binomialverteilung konsequenterweise nicht in den Abschnitt "Beziehung zu anderen verteilungen", sondern nach "Zentraler Grenzwertsatz". --Smeyen | Disk 17:07, 16. Aug. 2007 (CEST)
Beispiel Würfelversuch
Die Summen von zwei Würfeln sind auch bei unendlich vielen Versuchen nicht disket normalverteilt, auch nicht näherungsweise. Die Wahrscheinlichkeitsdichtefunktion der Summe zweier gleichverteilter Zufallsvariablen ist immer eine Dreiecksfunktion (entsprechend der Faltung zweier Rechteckfunktionen). Im Falle von zwei Würfeln, deren Summe nach jedem Wurf bestimmt wird, hat man ebenfalls eine solche Dreiecksfunktion, nur diskret wegen der diskreten Zufallsvariable. Konkret: Das Ergebniss 7 tritt in sechs Kombinationen auf, die Ergebnisse 6 und 8 treten je in fünf Kombinationen auf, die Ergebnisse 5 und 9 je in vier Kombinationen, usw. Dieses Würfelbeispiel ist also fehl am Platz beim Thema "Normalverteilung". Auch der Abschnitt über dem Würfelbeispiel ist irreführend, aber das wurde hier auf der Diskussionseite schon einen Punkt weiter oben erwähnt. --87.180.140.162 00:36, 26. Jul. 2007 (CET)
Warum so?
Was ich beim lesen des Artikels bis hin zur ersten expliziten Darstellung der Normalverteilung nicht verstanden habe, ist warum man die Normalverteilung so angibt und warum z.B.: Messfehler auf einer Gaußkurve liegen? Liegt vllt an der oben erwähnten Aproximation von Binomialverteilungen? Man kann doch nicht einfach definieren, dass Messfehler Normalverteilt sind!
mfg 91.5.157.148 19:47, 22. Okt. 2007 (CEST)
- Das muss auch nicht per Gesetz so sein. Es ist halt häufig so oder man säuft sich die Verteilung normal. --Philipendula 20:38, 22. Okt. 2007 (CEST)
Einer der wesentlichen Gründe für dieses Verhalten ist der Zentrale Grenzwertsatz, nach dem eine Summe von sehr vielen unabhängigen Zufallsgrößen, von denen jede für sich einen kleinen Einfluss auf die Summe hat, näherungsweise normalverteilt ist. Und Messfehler kann man sich als solche Summen sehr vieler kleiner Einflüsse vorstellen. Natürlich darf keiner der Einflüsse ein besonderes Gewicht haben, das wäre dann ein systematischer Fehler und man kann dann nicht mehr annehmen, dass die Summe näherungsweise normalverteilt ist. -- Jesi 00:07, 23. Okt. 2007 (CEST)
mehrdim. normalverteilung
gudn tach!
im artikel steht im abschnitt zur mehrdim. NV:
Die multivariate Normalverteilung ist die einzige rotationssymmetrische multivariate Verteilung,
deren Komponenten stochastisch unabhängig sind.
- es muesste _standard_normalverteilung heissen, da fuer die rot.sym. floeten geht.
- rot.sym. ist nur fuer 3d-gebilde definiert, oder?
ich formuliere mal noch nix um, weil ich sichergehen will, den passus nicht missverstanden zu haben. -- 141.3.74.15 01:09, 30. Dez. 2007 (CET)
- Ich denke aber, beides lässt sich verallgemeinern. Rot.-Symmetrie bleibt auch nach Verschiebung erhalten, dann eben um eine andere Achse, sie lässt sich auch für mehr als drei Dim. formulieren, dann allerdings nicht mehr anschaulich. -- Jesi 06:46, 30. Dez. 2007 (CET)
- aeh, moment. mit meinte ich (ich war 141.3.74.15) den korrelationskoeffizienten und nicht den erwartungswert , welcher als verschiebung angesehen werden kann. dagegen deformiert den "zuckerhut". rot.sym. ist verschiebungs- aber nicht deformierungsinvariant. deshalb ist "normalverteilung" allgemein falsch. entweder man ergaenzt "unkorreliert" oder schreibt "standard-nv" (und weist ggf. auf die beliebigkeit von hin).
- meine frage zur def. von rot.sym. moechte ich praezisieren: _wo_ wird rot.sym. fuer Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle n} -dim-gebilde mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle n>3} definiert? -- seth 10:52, 30. Dez. 2007 (CET)
- Oh sry, da hab ich nicht richtig aufgepasst. -- Jesi 13:54, 30. Dez. 2007 (CET)
- Von deinen Vorschlägen würde mir der zweite (Standard-NV) besser gefallen, du solltest es im Artikel ändern. Nachtrag zur Symmetrie: Kugel- und Rotationssymmetrie werden auch für n Dimensionen definiert (kugelsymmetrisch bzw. rotationssymmetrisch, wenn invariant gegenüber Drehungen um einen festen Punkt bzw. um eine feste Gerade). -- Jesi 18:59, 30. Dez. 2007 (CET)
Summe von normalverteilten Zufallsvariablen
Ist eigentlich die Summe von zwei normalverteilten Zufallsvariablen immer normalverteilt (eventuell mit Varianz 0), selbst wenn die Variablen nicht unabhängig sind? (nicht signierter Beitrag von Cosine (Diskussion | Beiträge) 14:57, 10. Jun 2008 (CEST))
- Ja. Wobei Varianz = 0 eigentlich keine Verteilung mehr ist. -- Philipendula 17:18, 10. Jun. 2008 (CEST)
- Danke für die Antwort. Das kann man aber nicht mehr einfach mit einer Faltung beweisen, oder? --Cosine 17:22, 10. Jun. 2008 (CEST)
- @Philipendula: Bist du dir da sicher? Ich bin es (auf Anhieb) nicht. Und der Beweis mittels Faltung (bzw. einfacher Produkt der charakteristischen Funktionen) entfällt ja tatsächlich. -- Jesi 17:30, 10. Jun. 2008 (CEST)
- Äh, ihr könnt einen aber auch Sachen fragen. Für mich war das irgendwie selbstverständlich. Leider bin ich gerade auf Arbeit und habe keine gescheite Literatur da. Allerdings gibt es den Satz: Wenn Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline x} ein multinormalverteilter Zufallvektor mit Erwartungsvektor Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline \mu} und Varianzkovarianzmatrix Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline \Sigma} ist, dann ist die lineare Transformation Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline y = \underline {Ax} + \underline b} wieder normalverteilt mit E'vektor Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline {A \mu} + \underline b} und der Kovarianzmatrix Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline {A \Sigma A^T}} . Das dürte eine Verallgemeinerung der Summe zweier NVen sein. Wenn wir den Vektor x aus x1 und x2 zusammensetzen und A als Zeilenvektor (1 1) nehmen, haut das hin. -- Philipendula 18:20, 10. Jun. 2008 (CEST)
- Also, auch diesen Satz kenne ich nur für Vektoren mit unabhängigen Komponenten (wobei hier die egoistische Betonung auf ich liegt). Da die Sätze mit Unabhängigkeit immer die bekanntesten sind, kann es natürlich sein, dass es einen solchen Satz auch bei Abhängigkeiten in voller Allgemeinheit gibt, ich kann mir das aber nicht vorstellen. Bei Unabhängigkeit kann eben so viel "schiefgehen", dass solche allgemeinen Sätze wohl eher unüblich wären. Aber das ist natürlich nur Heuristik, ich habe weder irgend einen Beweis noch ein (Gegen)Beispiel. Der Zusatz Varianz=0 in der Fragestellung bezog sich meiner Meinung nach nicht auf die Summanden, sondern auf die Summe, weil man sonst das triviale Gegenbeispiel X und -X hätte. -- Jesi 20:01, 10. Jun. 2008 (CEST)
- Der obige Satz bezieht sich ja ausdrücklich auf Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline \Sigma} , die Kovarianzmatrix, die eben Kovarianzen der Zufallsvariablen beinhaltet. Siehe auch [1] -- Philipendula 12:57, 11. Jun. 2008 (CEST)
- Der Satz betrifft aber nicht einen "beliebig zusammengewürfelten Vektor" von normalverteilten Zufallsgrößen, sondern er setzt voraus, dass der Vektor insgesamt n-dimensional normalverteilt ist. Und da gilt der Satz "Ein Zufallsvektor Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X = (X_1, ..., X_n)}
ist genau dann standardnormalverteilt auf Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle R_n}
, wenn seine Komponenten Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X_i}
standardnormalverteilt und stochastisch unabhängig sind", siehe Normalverteilung#Mehrdimensionale Verallgemeinerung. -- Jesi 15:14, 11. Jun. 2008 (CEST)
- Wenn die Zufallsvariablen paarweise korreliert sind, sind sie automatisch multinormalverteilt. -- Philipendula 15:18, 11. Jun. 2008 (CEST)
- Der Satz betrifft aber nicht einen "beliebig zusammengewürfelten Vektor" von normalverteilten Zufallsgrößen, sondern er setzt voraus, dass der Vektor insgesamt n-dimensional normalverteilt ist. Und da gilt der Satz "Ein Zufallsvektor Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X = (X_1, ..., X_n)}
ist genau dann standardnormalverteilt auf Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle R_n}
, wenn seine Komponenten Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X_i}
standardnormalverteilt und stochastisch unabhängig sind", siehe Normalverteilung#Mehrdimensionale Verallgemeinerung. -- Jesi 15:14, 11. Jun. 2008 (CEST)
- also: Jesi hat recht, aber der zitierte satz bezieht sich nur auf die _standard_normalverteilten ZVs. bei den anderen normalverteilten sieht's anders aus. Philipendula betrachtet dagegen nur die gemeinsamen _normal_verteilungen, was der OP nicht voraussetzte. ich nenne als beispiel zwei normalverteilte ZVs mit nichtnormalverteilter gemeinsamer verteilung, z.b. X,Y\sim\mathcal(0,1) mit der gemeinsamen dichte f(x,y)= 2*(dichte der entsprechenden unkorrelierten, d.h. durch faltung erhaltenen 2d-normalverteilung) im positiven sowie im negativen quadranten, aber f(x,y)=0 in den beiden anderen quadranten.
- der OP sucht also afaics z.b. die gemeinsame verteilung zweier jeweils (nicht-entartet, d.h. \sigma\ne0) normalverteilter ZVs X,Y mit der eigenschaft, dass fuer ein eps>0 gilt: P(X+Y\in (-eps,eps))=0. -- seth 21:26, 11. Jun. 2008 (CEST)
- Noch einmal @Philipendula, weil ich es nicht verstanden habe: Wenn die Zufallsvariablen paarweise korreliert sind, sind sie automatisch multinormalverteilt? Das kann ich so nicht einsehen. Z.B. sind für eine normalverteilte Zv. X die Zv. in dem Vektor (X,-X) "paarweise" korreliert und beide normalverteilt, der Vektor ist aber nicht multinormalverteilt (es ist etwa P(X < x, -X < y ) = P(X < x, X > -y), und diese Wahrscheinlichkeit kann für passende x und y null werden). Wenn du aber meinst Wenn die Zufallsvariablen paarweise nicht korreliert sind, ..., dann stimmt es wieder, allerdings sind unkorrelierte normalverteilte Zv. eben auch unabhängig, und da sind wir wieder beim Anfang. (Seths Beitrag habe ich noch nicht gründlich genug durchgelesen, aber ich glaube, das ist es ähnlich beschrieben.) -- Jesi 00:11, 12. Jun. 2008 (CEST)
- Es freut mich, dass ich mit meiner kleinen Frage, die hier natürlich überhaupt nicht korrekt aufgehoben ist, weil die kein Mathe-Forum ist ;-), so viel Resonanz ausgelöst habe. Anmerkung @Jesi: Der Vektor (X,-X) ist multinormalverteilt, wenn X normalverteilt ist. Er geht aus der 2dimensionalen Standardnormalverteilung durch die lineare Abbildung: (x,y)-> (x,-x) hervor, falls X stadardnormalverteilt ist, oder verstehe ich was falsch? Viele Grüße. --Cosine 13:42, 12. Jun. 2008 (CEST)
- Also zunächst einmal war die Frage schon an einer richtigen Stelle gestellt, und du siehst ja, was du losgetreten hast. Zu deinem Einwand: Wenn du eine lineare Abbildung ins Spiel bringst, musst du den Ausgangsvektor genau angeben. Dieser ist nämlich V = (X, X) und er geht durch die lineare Transformation W = A · V mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle A = \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix}}
in W = (X, -X) über. Aber: Der von dir angewendete Satz gilt nur, wenn die Komponenten des Ausgangsvektors unabhängig sind. Und da diese Komponenten beide die gleiche Zufallsvariable sind, sind sie eben auch nicht unabhängig. Dass die gemeinsame Verteilung keine Normalverteilung ist, wollte ich oben schon andeuten (habe mich allerdings verschrieben). Man betrachtet die zweidimensionale Verteilungsfunktion FW(x,y) als zweidimensionale Punktfunktion. Diese ist definiert durch FW(x,y)=P(X < x, -X < y ) = P(X < x, X > -y). Setzt man jetzt z.B. x = 0, y = -1, dann ist die Wahrscheinlichkeit P(X < 0, X > 1) = 0 und damit FW(x,y) = 0. Die zweidimensionale Normalverteilungskunktion wird aber (wie auch die eindimensionale) nie null (beachte allerdings, dass das Bild im Artikel die Dichte darstellt, die Verteilungsfunktion erhält man daraus durch "Kumulation"). Also ist die gemeinsame Verteilung keine Normalverteilung. -- Jesi 14:33, 12. Jun. 2008 (CEST)
- Und wenn wir stattdessen folgende Matrix nähmen: Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \begin{pmatrix} 1 & 0 \\ -1 & 0 \end{pmatrix}}
? Ausgangsvektor (X,Y) mit X und Y unabhängig standardnomalverteilt. Oder muss die Matrix invertierbar sein? -- --Cosine 14:43, 12. Jun. 2008 (CEST)
- Ja, letzteres. -- Jesi 15:00, 12. Jun. 2008 (CEST)
- Und wenn wir stattdessen folgende Matrix nähmen: Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \begin{pmatrix} 1 & 0 \\ -1 & 0 \end{pmatrix}}
? Ausgangsvektor (X,Y) mit X und Y unabhängig standardnomalverteilt. Oder muss die Matrix invertierbar sein? -- --Cosine 14:43, 12. Jun. 2008 (CEST)
- Also zunächst einmal war die Frage schon an einer richtigen Stelle gestellt, und du siehst ja, was du losgetreten hast. Zu deinem Einwand: Wenn du eine lineare Abbildung ins Spiel bringst, musst du den Ausgangsvektor genau angeben. Dieser ist nämlich V = (X, X) und er geht durch die lineare Transformation W = A · V mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle A = \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix}}
in W = (X, -X) über. Aber: Der von dir angewendete Satz gilt nur, wenn die Komponenten des Ausgangsvektors unabhängig sind. Und da diese Komponenten beide die gleiche Zufallsvariable sind, sind sie eben auch nicht unabhängig. Dass die gemeinsame Verteilung keine Normalverteilung ist, wollte ich oben schon andeuten (habe mich allerdings verschrieben). Man betrachtet die zweidimensionale Verteilungsfunktion FW(x,y) als zweidimensionale Punktfunktion. Diese ist definiert durch FW(x,y)=P(X < x, -X < y ) = P(X < x, X > -y). Setzt man jetzt z.B. x = 0, y = -1, dann ist die Wahrscheinlichkeit P(X < 0, X > 1) = 0 und damit FW(x,y) = 0. Die zweidimensionale Normalverteilungskunktion wird aber (wie auch die eindimensionale) nie null (beachte allerdings, dass das Bild im Artikel die Dichte darstellt, die Verteilungsfunktion erhält man daraus durch "Kumulation"). Also ist die gemeinsame Verteilung keine Normalverteilung. -- Jesi 14:33, 12. Jun. 2008 (CEST)
- (bk) normalerweise wird die dichte und damit auch die verteilungsfunktion der normalverteilung nie 0, aber wenn man die entarteten normalverteilungen (\sigma=0, stichwort: dirac-delta-distribution) hinzunimmt, dann halt doch (sogar \lambda^1-fast ueberall, \lambda=borelmass); hattest du ja oben selbst gesagt. insofern ist das (X,-X)-beispiel nicht soo gut. -- seth 15:03, 12. Jun. 2008 (CEST)
- Diesen Einwand verstehe ich (wieder einmal) nicht. Die zweidimensionale Verteilung FW(x, y) = P (X < x, X > -y) ist zwar in vielen Bereichen gleich null, in "vielen" aber auch echt positiv. So ist sie, wie oben ausgeführt, in dem Punkt (0, -1) und auch in einem kleinen Kreis um diesen Punkt null. Aber in (1, 0) ist FW(1,0) = P (X < 1, X > 0) = Φ(1) - Φ(0) und auch in einem kleinen Kreis um diesen Punkt trägt sie Wahrscheinlichkeitsmasse. Das ist ja alles andere als etwas Entartetes. -- Jesi 19:16, 12. Jun. 2008 (CEST)
- (bk) normalerweise wird die dichte und damit auch die verteilungsfunktion der normalverteilung nie 0, aber wenn man die entarteten normalverteilungen (\sigma=0, stichwort: dirac-delta-distribution) hinzunimmt, dann halt doch (sogar \lambda^1-fast ueberall, \lambda=borelmass); hattest du ja oben selbst gesagt. insofern ist das (X,-X)-beispiel nicht soo gut. -- seth 15:03, 12. Jun. 2008 (CEST)
- Oh, ich habs zu spät geschnallt. Du dachtest warscheinlich, das Beispiel (X, -X) sollte noch für das "Summenproblem" sein. Nein, es sollte ein Beispiel dafür sein, dass ein Vektor aus normalverteilten Komponenten nicht multinormalverteilt ist. -- Jesi 19:54, 12. Jun. 2008 (CEST)
Eigentlich brauch ich ja gar nichts mehr dazu sagen, wie ich sehe. Ich hab mal noch die Definition rausgekramt:
Es gibt zwei Arten von Definition einer multinormalen Verteilung:
1. Wenn der Zufallsvektor Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline x}
der Ordnung k eine p-variate Normalverteilung hat, dann und nur dann kann Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline x}
dargestellt werden als Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline x=\mu + A\underline z}
wobei Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle A_{pxp}}
ist und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline z}
ein Vektor aus p unabhängigen standardnormalverteilten Zufallsvariablen.
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle AA^T}
ist dann die Kovarianzmatrix von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline x}
, die wir Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Sigma}
nennen wollen. Also sollten zumindest unabhängige ZVen zugrunde liegen.
2. Wenn Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline x}
von oben eine multivariate Normalverteilung hat, dann und nur dann
hat Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle Y=\underline a^T\underline x}
eine univariate Normalverteilung für jeden konstanten Vektor Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline a}
.
Y ist also eine Summe aus korrelierten normalverteilten Zufallsvariablen.
Die Kovarianzmatrix kann auch singulär von einem Rang k<p sein, dann ergibt sich eine sog. singuläre Multinormalverteilung als Projektion auf den k-dimensionalen Unterraum.
Das Beispiel mit dem (X, -X) mag ich jetzt nicht näher beleuchten, es ergäbe auf jeden Fall eine singuläre Korrelationsmatrix, weil natürlich X und -X exakt linear abhängig sind und daher eine Korrelation von -1 haben. Da diese Matrix den Rang 1 hat, hätten wir wohl automatisch eine univariate Verteilung. -- Philipendula 21:05, 12. Jun. 2008 (CEST)
- eben, beim beispiel (X, -X) waere die dichte f(x,y)=\delta(x+y), mit delta=dirac-delta-distribution.
- Jesi hat trotzdem recht, wenn zwei zufallsvariablen X,Y normalverteilt sind, muss ihre gemeinsame verteilung nicht einer 2d-normalverteilung unterliegen. ein beispiel dafuer habe ich oben bereits angegeben. die sache mit den quadranten. hier noch mal die dichte:
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle f(x,y)=\begin{cases} 2\cdot(\text{2d-gauss}(x,y)), & \text{falls }xy\ge 0\\ 0, & \text{falls }xy<0 \end{cases}}
- (alles noch fernab von der summengeschichte.)-- seth 22:00, 12. Jun. 2008 (CEST)
- Ich versuche mal zusammenzufassen, was ich verstanden habe:
- * Eine multivariat-Normalverteilter Zufallsvektor Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline x} lässt sich schreiben als Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \underline x=\mu + A\underline z} , wobei z standardnormalverteilt ist.
- * Demnach ist der Vektor (X,-X) von oben normalverteilt, da er sich genauso schreiben lässt mit mu=0 und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle A=\begin{pmatrix} 1 & 0 \\ -1 & 0 \end{pmatrix}}
- * Wenn aber X und Y zwei normalverteilte Zufallsvariablen sind, dann muss (X,Y) noch lange nicht (multivariat) normalverteilt sein.
- * All das hilft uns nicht weiter, zu entscheiden, ob meine Ausgangsvermutung gilt oder nicht, d.h. wir wissen immer noch nicht, ob es zwei abhängige normalverteilte Zufallsvariablen gibt, deren Summe nicht normalverteilt (oder konstant) ist.
- Stimmt das? Viele Grüße --Cosine 22:10, 12. Jun. 2008 (CEST)
- der zweite punkt bedarf einer ergaenzung: wenn der korrelationskoeefizient -1 ist, wie im fall (X, -X), dann gibt es keine gewoehnliche normalverteilung, die dazu passt, sondern nur eine entartete (d.h. standardabweichung=0). die konventionelle normalverteilung laesst nur positive standardabweichungen zu (wg. division durch sigma). wenn man aber den limes bildet, erhaelt man die heaviside-funktion (bei der verteilungsfunktion) bzw. die dirac-delta-distribution (bei der dichte).
- damit muss auch der vierte punkt ergaenzt werden. die frage ist also: existiert eine gemeinsame verteilung zweier jeweils normalverteilter zufallsvariablen X und Y, sodass die zufallsvariable Z=X+Y nicht normalverteilt (und auch nicht entartet normalverteilt) ist? und die beantwortun wurde hier bisher noch nicht geklaert. -- seth 22:45, 12. Jun. 2008 (CEST)
Wenn man sich in die Diskussion "unbefangen" einliest, entsteht direkt zu Beginn eine Frage: Was eigentlich ist die Summe von zwei normalverteilten Zufallsvariablen ? Eine Zufallsvariable ist ja zuerst einmal eine Variable wie jede andere auch. Zufällig ist ja wohl nicht die Variable, sondern der dieser zugeordnete Funktionswert. Oder sehe ich das falsch? FellPfleger 08:34, 13. Jun. 2008 (CEST)
- Formal definiert man sich eine Zufallsvariable als eine (messbare) Abbildung von einem Wahrscheinlichkeitsraum in die Reellen Zahlen. Funktionen in die reellen Zahlen kann man addieren und somit ist kein formales Problem bei der Fragestellung gegeben. Das Problem entsteht dadurch, dass dieser Wahrscheinlichkeitsraum immer schön im Hintergrund bleibt und man eigentlich nichts darüber weiß, außer dass er groß genug sein muss, um alle Zufallsvariablen, die man für ein mathematisches Modell braucht, zu "beherbergen". Und solange alle vorkommenden Zufallsvariablen alle schön unabhängig sind, ist es auch egal, wie dieser ominöse Wahrscheinlichkeitsraum aussieht, dann ist die gesamte relevante Information durch die Verteilung gegeben und man kann schön drauf los rechnen, ohne sich um den zugrundeliegenden Wahrscheinlichkeitsraum zu kümmern. Aber sobald die nicht mehr unabhängig sind, wird's eklig. --Cosine 11:22, 13. Jun. 2008 (CEST)
Anmerkung wieder gelöscht. Es sind einfach zu viele Voraussetzungen nicht definiert, Schlüsse sind damit rein zufällig. FellPfleger 22:22, 13. Jun. 2008 (CEST)
Letzter Nachtrag zu diesem Thema: Ich habe jetzt mal einen Experten gefragt und der hat mir ein Gegenbeispiel verraten: Als Zutaten nehmen wir ein X standardnormalverteilt, und eine diskrete Zufallsvarieble Z, die nur -1 und +1 mit Wahrscheinlichkeit jeweils 50% annimmt und X und Z seien unabhängig. So etwas lässt sich konstruieren. Dann definiere ich Y:=XZ und rechne nach, dass Y auch normalverteilt ist. Aber X+Y ist nicht mehr normalverteilt. Also ist die Vermutung vom Anfang falsch. Schade eigentlich... Es wäre so schön gewesen. Vielen Dank an alle, die mitgeraten haben.--Cosine 16:27, 24. Jun. 2008 (CEST)
Notation in Graphik (Normal density.svg) stimmt nicht überein mit Notation in Textkörper
Im Textkörper wurde sich auf die Notation X~Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N(\mu, \sigma^2)} geeinigt. (Was mir, so nebenbei, als gute/bessere Wahl erscheint.) Die Graphik ganz oben im Artikel zeigt allerdings eine blaue Linie, die nach der Notation im Textkörper nicht X~Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N(0, 2)} sondern tatsächlich X~Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N(0, 2^2)} also X~Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N(0, 4)} zeigt. Offensichtlich wurde die Graphik gefertigt und die Notation XFehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N(\mu, \sigma)} zu Grunde gelegt -- dann nämlich stimmt, was dort zu sehen ist. Wer aber der Notation im Textkörper des Eintrags folgt und auf das Bild schaut, sieht eine "zu breite" blaue Normalverteilung. Analog gilt das hier Gesagte natürlich für die violette PDF: Das, was man im Bild sieht, ist X~Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N(0, 1.5^2)} , wenn man der Notation folgt, die im Text vorgeschlagen wird. Frage: Wer macht eine neue Graphik? --Sewenz 12:29, 10. Okt. 2008 (CEST)
- Okay, ich habe eine Graphik (Dateiformat: pdf) erstellt, die den Fehler korrigiert und mehr oder weniger genauso aussieht, wie die bisherige. Nur leider erhalte ich immer wieder (heute nachmittag und eben wieder) folgende Mitteilung: "Die Datei ist beschädigt oder hat eine falsche Datei-Erweiterung. Bitte überprüfe die Datei und wiederhole den Hochlade-Vorgang." Aus den FAQ bin ich nicht wirklich schlau geworden. Wenn hier niemand eine einfache und schnelle Antwort hat, frage ich in der Redaktion Bilder nach. --Sewenz 19:07, 10. Okt. 2008 (CEST)
- JUHU! Es ist geschafft. Hier kann man die neue Graphik ansehen, die der Notation folgt, die auch im Textkörper benutzt wird.
Jetzt muss das Ding nur noch eingebunden werden. Wenn ich das richtig sehe -- bin kein WP-Insider -- habe ich nicht die Rechte die Graphik an der Stelle, an der sie hier verwandt wird (ganz oben im Artikel), zu ersetzen. Wie funktioniert das jetzt?(nicht signierter Beitrag von Sewenz (Diskussion | Beiträge) 15:09, 11. Okt. 2008 (CEST))
- JUHU! Es ist geschafft. Hier kann man die neue Graphik ansehen, die der Notation folgt, die auch im Textkörper benutzt wird.
Schreibweise
Parametrisierung der Normalverteilung
Ich habe eine Frage zu den Parametern der Normalverteilung: auf der Seite wird sie mit der Standardabweichung parametrisiert (Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N \left( \mu,\sigma \right)} ), so wie das im angelsächsichen Sprachraum üblich ist. In Deutschland findet man sie häufig mit der Varianz parametrisiert, also Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N \left( \mu,\sigma^2 \right)} . Ist die Art der Parametrisierung in diesem Artikel Konsens? ich wollte die Definition jetzt weiterbenutzen (siehe Wiener-Prozess) 84.128.132.64 19:20, 29. Nov 2004 (CET)
Ich glaube, hier macht man sich keine allzugroßen Gedanken dazu. Es kommt darauf an, was man mit der Verteilung anfangen will. Prinzipiell gibt es zwei Ansätze: Man betrachtet die Normalverteilung als Dichtekurve einer verteilten Größe. Dann ist die Fläche der Kurve über alle X zu Eins zu setzen und um eine Abschätzung der Breite zu haben, verwendet man die Standardabweichung als X-Einheit. Also hat die Normalverteilung die Fläche 1, den Schwerpunkt 0 und die Standardabweichung 1. Wenn man so normiert, ist natürlich auch die Varianz Eins. Ursprünglich wurde die Normalverteilung dazu benutzt, eine Aussage über die Fehlerquellen einer Messreihe zu machen. Wichtig war hierbei die Landvermessung und die Sternenkartierung. Die angegebenen Parameter sind Spezialfälle der statistischen Momente. Stimmen die statistischen Momente einer Messreihe mit denen der Normalverteilung überein, kann ein systematischer Fehler ausgeschlossen werden. Neben Fläche, Schwerpunkt und Varianz sind gebräuchlich Schiefe (Skew) und Stauchung( Excess). Höhere statistische Momente haben keine eigenen Namen, da ihre Bestimmung sehr fehlerbehaftet ist, wenn man sich nur ganz wenig in der Positionierung der Grundlinie irrt. Da die Normalverteilung durch drei Parameter festgelegt ist, sind damit alle statistischem Momente bestimmt. Die ungeraden Momente sind alle Null, da die NV symmetrisch ist, die geraden haben definierte Zahlenwerte. Bestimmt man die statistischen Momente unbekannter, normalverteilungsähnlicher Messreihen und zieht die Momente der NV ab, so erhält man bei vorliegen normalverteilter Messreihen jeweils Nullwerte. Die um die Momente der NV korrigierten Werte heißen Kummulanten.
Anders sieht es aus, wenn man die Normalverteilung zum Ausgang einer Vektorraumbasis macht. Wenn man diese orthonormiert, dann ist nicht die Fläche unter der Kurve = 1 zu wählen, sondern das Integral über das Betragsquadrat der Funktion. Siehe auch Hermitsche Funktionen. RaiNa 20:43, 29. Nov 2004 (CET)
- Also das mit dem angelsächsischen Sprachraum scheint nicht 100%ig zuzutreffen, ich habe zwei englische Bücher über W'theeorie vorliegen (Lindgren und Grimmet/Stirzacker), die beide mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N \left( \mu,\sigma^2 \right)} notieren. --Philipendula 22:44, 29. Nov 2004 (CET)
- Muss mal eine Lanze brechen für Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N \left( \mu,\sigma \right)} - Ich hab bis jetzt ausschließlich diese Art der Notation gelesen. (Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N \left( \mu,\sigma^2 \right)} ) kommt mir recht exotisch vor. --Crus4d3r
Nach meiner Erfahrung ist beides in etwa ähnlich oft gebräuchlich, ich denke auch nicht, dass hier der angelsächsische Raum andere Vorzüge hat. Es ist einfach eine simple Bezeichnungsfrage, bei denen jeder Autor bekanntlich seinen eigenen Stil hat. Auch hat das ganze mit den inhaltlichen Ausführungen von RaiNa nicht allzuviel zu tun. Natürlich sollte in einem Artikel durchgängig eine Bezeichnung verwendet werden, ob wir das in der ganzen Wikipedia schaffen, wage ich zu bezweifeln. Eine technische Kleinigkeit spricht für Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N \left( \mu,\sigma \right)} . Wenn man nämlich die dazugehörige Verteilungsfunktion betrachtet, wird diese in der Regel mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Phi} bezeichnet, und die Parameter werden als Indizes geschrieben. Und das sieht Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \;\Phi_{\mu,\sigma}(x)} optisch etwas einfacher aus als Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Phi_{\mu,\sigma^2}(x)} , analog hat man dür die Wahrscheinlichkeitsdichte Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \;\varphi_{\mu,\sigma}(x)} statt Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \varphi_{\mu,\sigma^2}(x)} . -- Jesi 17:32, 14. Aug. 2007 (CEST)
Sigma Quadrat?
Statt Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X \sim N(\mu, \sigma)} begegnet mir oft Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X \sim N(\mu, \sigma^2)} . Kann mir jemand den Unterschied erklären oder besser sogar im Artikel einbauen? Dasselbe kann es ja nicht sein, da sich durch das Quadrat ja alle Formeln ändern müssten. Oder nicht? Wie gesagt, besser gleich im Artikel einbauen als hier zu antworten. Mich verwirrt die unterschiedliche Handhabe. 128.176.114.42 16:34, 7. Dez 2004 (CET)
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2} ist die Varianz und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma} ist ihre Wurzel, die Standardabweichung. An der Berechnung ändert sich nichts, z.B.
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle f(x)= \frac{1}{\sigma\sqrt{2\pi}}\, e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}}
und
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle Z = \frac{X - \mu}{\sigma} }
Hier geht es nur um die Bezeichnung der Normalverteilung. Die Notation mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2} scheint die mir häufigere zu sein. --Philipendula 21:26, 7. Dez 2004 (CET)
Ich habe mich auch etwas an der Notation gestört und mir mal herausgenommen, dass zu ändern. Ich hoffe, es stört sich keiner dran. --Smeyen 12:54, 9. Dez 2004 (CET)
- Also ich nicht. --Philipendula 17:21, 9. Dez 2004 (CET)
- Eindeutigkeit muss sein! Denn wenn statt Buchstaben Zahlen stehen z.B. Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N \left( 0, 0.25 \right)} , dann weiß man nicht mehr, ob es sich um Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2} oder um Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma} handelt. -- 17:42, 6. Jul. 2008 (CEST) (nicht signierter Beitrag von 91.21.254.21 (Diskussion) 20:28, 5. Jul 2008 (CEST)), (nicht signierter Beitrag von 91.21.248.39 (Diskussion) 17:42, 6. Jul 2008 (CEST))
- Nun ja....wenn eine Zufallsvariable Normalverteilt sein soll und bestimmte Werte angegeben sind, dann wird doch auch angegeben um welche Parameter es sich handelt! Also ob nun Normalverteil mit der Varianz...oder Normalverteil mit der Standartbweichung...von daher ist die Notation doch hier irrelvant, wenn jeder weiß, worum es geht!
- --88.72.208.233 10:45, 31. Mär. 2009 (CEST)
Mathematica und Mathcad (und andere?) verwenden die Standardabweichung als Parameter. So gesehen wäre die Schreibweise Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal N(\mu, \sigma)} vorzuziehen. --62.47.204.208 14:51, 9. Dez. 2008 (CET)
Archivierung
Hm, irgendwie bordet hier das etwas über. Sollte man hier nicht eventuell ein Archiv anlegen? Was wäre mit automatischer Archivierung? --Tolentino 12:24, 31. Mär. 2009 (CEST)
- hab jetzt eine automatische angelegt und die erste archivierung mal selbst vorgenommen. die archivierung der verschachtelten threads sollte ebenfalls manuell durchgefuehrt werden. falls ich jetzt zu viel archiviert haben sollte, einfach die entsprechenden threads zurueckverschieben. -- seth 12:56, 31. Mär. 2009 (CEST)
Simulation mehrdimensionaler normalverteilter Zufallsvektoren
Bitte mal Meinungen dazu abgeben, ob ihr einen Sinn im Abschnitt "Simulation mehrdimensionaler normalverteilter Zufallsvektoren -> Plausibilisierung -> Kovarianz" erkennen könnt. Warum 1/n und Summe über i? -- zitiere_kinsey 10:04, 25. Jun. 2009 (CEST)
- Ich hatte revertiert, weil es sich um einen Vektor und nicht um eine Zufallsvariable handelt. Ansonsten krankt die Darstellung schon ziemlich. Auch der Abschnitt http://de.wikipedia.org/wiki/Normalverteilung#Mehrdimensionale_Verallgemeinerung könnte etwas Politur vertragen -- Philipendula 11:07, 25. Jun. 2009 (CEST)
- Da eine Zufallsvariable ein- oder mehrdimensional sein kann, sehe ich hier kein Problem. Außerdem wollte ich die Formulierung "Realisierung der Normalverteilung" ändern, die in dem Zusammenhang nicht richtig ist. Ein weiterer Punkt war, dass eine geeignete Matrix U auch anders gewonnen werden kann als durch Cholesky-Zerlegung, z.B. durch Diagonalisierung (deswegen hatte ich ein "z.B." vor "Cholesky-Zerlegung" gesetzt). Die Hauptmotivation war aber, dass die Plausibilisierung für die Kovarianzmatrix gar keine ist (oder?). -- zitiere_kinsey 15:24, 25. Jun. 2009 (CEST)
- Inwiefern Plausibilisierung? -- Philipendula 15:59, 25. Jun. 2009 (CEST)
- Da eine Zufallsvariable ein- oder mehrdimensional sein kann, sehe ich hier kein Problem. Außerdem wollte ich die Formulierung "Realisierung der Normalverteilung" ändern, die in dem Zusammenhang nicht richtig ist. Ein weiterer Punkt war, dass eine geeignete Matrix U auch anders gewonnen werden kann als durch Cholesky-Zerlegung, z.B. durch Diagonalisierung (deswegen hatte ich ein "z.B." vor "Cholesky-Zerlegung" gesetzt). Die Hauptmotivation war aber, dass die Plausibilisierung für die Kovarianzmatrix gar keine ist (oder?). -- zitiere_kinsey 15:24, 25. Jun. 2009 (CEST)
Vielleicht ist ja auch der Abschnitt http://de.wikipedia.org/wiki/Multivariate_Verteilung#Die_multivariate_Normalverteilung etwas erhellender. -- Philipendula 16:19, 25. Jun. 2009 (CEST)
Ich schlage vor, die beiden Abschnitte, in denen mehrdimensionale Themen besprochen werden, aus diesem Artikel herauszunehmen und in den Abschnitt http://de.wikipedia.org/wiki/Multivariate_Verteilung#Die_multivariate_Normalverteilung aufzunehmen. Dabei würde ich ähnliche Bearbeitungen vornehmen, wie oben diskutiert. Im Artikel über die Normalverteilung kann dann ein Verweis auf den Artikel über multivariate Verteilungen stehen. zitiere_kinsey 17:05, 1. Jul. 2009 (CEST)
Unverständlich
Große Teile des Artikels sind für Nichtmathematiker unverständlich, was nicht im Sinne einer Enzyklopädie sein kann. Ich plädiere für einen populärwissenschaftlichen Ausbau des Artikels und eine Auslagerung der mathematischen Details nach Mathematische Hintergründe zur Normalverteilung (o.ä.) oder gleich nach Wikibooks. --Carbenium 13:27, 9. Apr. 2009 (CEST)
Wikipedia ist ein Fachlexikon. Als Physiker hat mir Wikipedia im Bereich Mathematik in einigen Fragen sehr geholfen. Wenn dir die Artikel zu schwer sind, dann kauf dir doch ein populärwissenschaftliches Buch. Die Wikipedia Autoren sind nämlich keine Popularisatoren, sondern Fachleute mit Liebe zu ihrer Disziplin, keine Wissenschaftsjournalisten. Abgesehen davon sind die Artikel im Bereich Mathematik fast immer korrekt, was man von den Wikipedia Artikeln anderer Fachgebiete nun wirklich nicht sagen kann. -- Thomas118 19:44, 29. Jul. 2009 (CEST)
Änderungen für Erzeugung mehrdimensionaler normalverteilter Zufallszahlen
Hallo Philipendula, wir hatten Ende Juni 2009 den Abschnitt über Erzeugung mehrdimensionaler normalverteilter Zufallszahlen diskutiert. Dies findet sich nun im Archiv der Diskussionsseite (letzter Eintrag). Ich möchte die dort beschriebenen Änderungen durchführen und bitte Dich, nicht meine Änderungen rückgängig zu machen. Wenn es inhaltliche Einwände gibt, dann kannst Du sie ja auch in die Diskussionsseite eintragen. -- zitiere_kinsey 14:33, 1. Nov. 2009 (CET)
- Kann ich nachvollziehen. Mittlerweile und spätestens dann hat aber das Unterthema Multivariate Normalverteilung soviel Gewicht, das man an eine Auslagerung denken sollte. – Benutzer:Erzbischof 10:11, 2. Nov. 2009 (CET)
- Dann werde ich zuerst noch die Informationen aus "Mehrdimensionale Verallgemeinerung" in Multivariate Normalverteilung eintragen und den Abschnitt "Mehrdimensionale Verallgemeinerung" löschen. Danach kann sich jemand darum kümmern, aus Multivariate Normalverteilung einen eigenen Artikel zu machen. Einverstanden? -- zitiere_kinsey 21:06, 2. Nov. 2009 (CET)
- Hallo, ich habe jetzt den Abschnitt gelöscht. Dies bitte nicht ohne vorherige Diskussion rückgängig machen. Danke. -- zitiere_kinsey 10:02, 6. Nov. 2009 (CET)
Simulation mehrdimensionaler normalverteilter Zufallsvektoren (aus dem Archiv)
Bitte mal Meinungen dazu abgeben, ob ihr einen Sinn im Abschnitt "Simulation mehrdimensionaler normalverteilter Zufallsvektoren -> Plausibilisierung -> Kovarianz" erkennen könnt. Warum 1/n und Summe über i? -- zitiere_kinsey 10:04, 25. Jun. 2009 (CEST)
- Ich hatte revertiert, weil es sich um einen Vektor und nicht um eine Zufallsvariable handelt. Ansonsten krankt die Darstellung schon ziemlich. Auch der Abschnitt http://de.wikipedia.org/wiki/Normalverteilung#Mehrdimensionale_Verallgemeinerung könnte etwas Politur vertragen -- Philipendula 11:07, 25. Jun. 2009 (CEST)
- Da eine Zufallsvariable ein- oder mehrdimensional sein kann, sehe ich hier kein Problem. Außerdem wollte ich die Formulierung "Realisierung der Normalverteilung" ändern, die in dem Zusammenhang nicht richtig ist. Ein weiterer Punkt war, dass eine geeignete Matrix U auch anders gewonnen werden kann als durch Cholesky-Zerlegung, z.B. durch Diagonalisierung (deswegen hatte ich ein "z.B." vor "Cholesky-Zerlegung" gesetzt). Die Hauptmotivation war aber, dass die Plausibilisierung für die Kovarianzmatrix gar keine ist (oder?). -- zitiere_kinsey 15:24, 25. Jun. 2009 (CEST)
- Inwiefern Plausibilisierung? -- Philipendula 15:59, 25. Jun. 2009 (CEST)
- Da eine Zufallsvariable ein- oder mehrdimensional sein kann, sehe ich hier kein Problem. Außerdem wollte ich die Formulierung "Realisierung der Normalverteilung" ändern, die in dem Zusammenhang nicht richtig ist. Ein weiterer Punkt war, dass eine geeignete Matrix U auch anders gewonnen werden kann als durch Cholesky-Zerlegung, z.B. durch Diagonalisierung (deswegen hatte ich ein "z.B." vor "Cholesky-Zerlegung" gesetzt). Die Hauptmotivation war aber, dass die Plausibilisierung für die Kovarianzmatrix gar keine ist (oder?). -- zitiere_kinsey 15:24, 25. Jun. 2009 (CEST)
Vielleicht ist ja auch der Abschnitt http://de.wikipedia.org/wiki/Multivariate_Verteilung#Die_multivariate_Normalverteilung etwas erhellender. -- Philipendula 16:19, 25. Jun. 2009 (CEST)
Ich schlage vor, die beiden Abschnitte, in denen mehrdimensionale Themen besprochen werden, aus diesem Artikel herauszunehmen und in den Abschnitt http://de.wikipedia.org/wiki/Multivariate_Verteilung#Die_multivariate_Normalverteilung aufzunehmen. Dabei würde ich ähnliche Bearbeitungen vornehmen, wie oben diskutiert. Im Artikel über die Normalverteilung kann dann ein Verweis auf den Artikel über multivariate Verteilungen stehen. zitiere_kinsey 17:05, 1. Jul. 2009 (CEST)
Es fehlt: Geschichte und Herleitung
Wie ist Herr Gauß auf genau diese Formel gekommen? Lässt sich die Funktion logisch herleiten (wie) oder passt sie einfach am besten auf empirische Daten? [http://www.madeasy.de/2/gauss.htm Kurzer Abriss der Geschichte, aber nicht Herleitung. --Zulu55 17:37, 2. Okt. 2009 (CEST)
- Stimmt, Geschichtliches fehlt, hier besteht Handlungsbedarf. Ach ja von wegen Ursprung Gauß: Stiglers_Gesetz --Fredric 21:07, 28. Dez. 2009 (CET)
Invarianz gegenüber Faltung -> n² muss ein n sein (?)
-- 91.21.124.65 20:27, 22. Feb. 2010 (CET) Wenn mich nicht alles täuscht muss statt dem n² im Abschnitt "Invarianz gegenüber Faltung" ein n stehen.. (nicht signierter Beitrag von 84.61.125.137 (Diskussion | Beiträge) 18:17, 11. Mai 2009 (CEST))
- In Georgii, Stochastik, de Gruyter 2009 (4. Auflage) ist auif Seite 207 für den Maximum-Likelihood-Schätzer im n-fachen Gauß'schen Produktmodell V=\frac{1}{2}\sum_i=1^n{(X_i-M)^2} angegeben. (nicht signierter Beitrag von 85.183.97.9 (Diskussion | Beiträge) 10:15, 21. Jan. 2010 (CET))
-- auf http://home.arcor.de/dfcgen/wpapers/probabil/probabilsu8.html wird die Varianz der Summe von normalverteilten Zufallsgrößen zu \sigma_1^2 + \sigma_2^2 berechnet => demnach müsste es n anstelle von n^2 heißen (nicht signierter Beitrag von 83.171.185.71 (Diskussion) 12:09, 8. Jul 2010 (CEST))
Formel für Menge der Messwerte
Im Artikel heißt es - und so hatte ich das auch vor zwanzig Jahren im Mathe-LK gelernt - dass
- 68,27 % aller Messwerte haben eine Abweichung von höchstens Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma} vom Mittelwert,
- 95,45 % aller Messwerte haben eine Abweichung von höchstens Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 2 \sigma} vom Mittelwert,
- 99,73 % aller Messwerte haben eine Abweichung von höchstens Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 3 \sigma} vom Mittelwert.
Ich nehme weiterhin mal an:
- 0,00 % aller Messwerte haben eine Abweichung von höchstens Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 0 \sigma} vom Mittelwert.
- 100,00 % aller Messwerte haben eine Abweichung von höchstens Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \infty \sigma} vom Mittelwert.
Für diese Prozentangaben gibt's doch sicherlich auch 'ne Formel. Klar ist: Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \lim_{\sigma \to \infty} F(\sigma) = 1}
Oder war ich einfach nur zu blind um sie hier bzw. im Artikel zur Standardabweichung zu entdecken?
Dank' Euch für Eure Antwort
-- Tolukra 10:08, 07. September 2010 (CEST)
- Es wäre besser Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \lim_{x \to \infty} F(x) = 1} zu schreiben, denn mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma} wird die Standartabweichung gemeint. Die "Prozentangaben" kann man berechnen oder ablesen aus eine Tabelle. Die Verteilungsfunktion F hat die Bedeutung:
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle F(x) = P(X\le x),}
- also die Wahrscheinlichkeit P dass das Messergebnis X höchstens den Wert x hat. Zum Beispiel, wenn die Messergebnisse normalverteilt sind mit Mittelwert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu} und Standartabweichung Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma} , gilt:
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle P(X-\mu\le \sigma) = F(\mu + \sigma) = \Phi(1) = 0,8413}
- und also:
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle P(X-\mu> \sigma) = 1- 0,8413 = 0,1587}
- Der Symmetrie wegen gilt dann auch:
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle P(|X-\mu|> \sigma) =2\times0,1587 = 0,3174}
- und:
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle P(|X-\mu|\le \sigma) = 1 - 0,3174 = 0,6826}
- Wenn du dies verstanden hast, ist deine Frage beantwortet. Nijdam 13:26, 7. Sep. 2010 (CEST)
- Sorry, ich hab's so leider nicht verstanden. Abi ist wohl doch zu lang her?
- Aber vielleicht hab' ich mich auch nur sehr ungeschickt ausgedrückt.
- Hintergrund meiner Frage ist, dass ich gerne wüsste, im Bereich von wieviel Sigma z.B. 33,333 Prozent aller Messwerte liegen.
- Konkret möchte ich eine Auswertung erstellen und dabei die Messwerte in drei Klassen unterteilen, wobei die Klassen gleich viel Messwerte beinhalten sollen:
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 33,\overline{3}} % aller Messwerte haben eine Abweichung von höchstens a Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma} vom Mittelwert,
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 33,\overline{3}} % aller Messwerte haben eine Abweichung von mindestens a Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma} und höchstens b Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma} vom Mittelwert,
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 33,\overline{3}}
% aller Messwerte haben eine Abweichung von mindestens b Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma}
vom Mittelwert.
- Und wenn ich morgen mit mehr Klassen oder einer anderen Einteilung arbeiten möchte, ...
- -- Tolukra 08. September 2010, 13:38 (CEST)
- Sorry, ich hab's so leider nicht verstanden. Abi ist wohl doch zu lang her?
Es fehlt: Geschichte und Herleitung
aus dem Archiv hochgeholt --Zulu55 09:34, 29. Mär. 2011 (CEST)
Wie ist Herr Gauß auf genau diese Formel gekommen? Lässt sich die Funktion logisch herleiten (wie) oder passt sie einfach am besten auf empirische Daten? [http://www.madeasy.de/2/gauss.htm Kurzer Abriss der Geschichte, aber nicht Herleitung. --Zulu55 17:37, 2. Okt. 2009 (CEST)
- Stimmt, Geschichtliches fehlt, hier besteht Handlungsbedarf. Ach ja von wegen Ursprung Gauß: Stiglers_Gesetz --Fredric 21:07, 28. Dez. 2009 (CET)
- Hauptautoren informiert --Zulu55 09:35, 29. Mär. 2011 (CEST)
- gudn tach!
- ich fuehle mich zwar nicht als hauptautor des artikels, aber da ich gefragt wurde: zum geschichtsteil kann ich nichts beisteuern. -- seth 15:44, 3. Apr. 2011 (CEST)
Box-Muller
Ich mach mir nichts aus ein derartiges Program. Ist es informativ? Nijdam 19:41, 15. Dez. 2011 (CET)
- Ich denke auch, dass das Programm keinen großen Mehrwert liefert. Außerdem ist es ungeschickt, dass aus zwei gleichverteilten nur eine normalverteilte Zahl berechnet wird. Normalerweise müsste man gleich zwei normalverteilte berechnen. -- HilberTraum 21:32, 15. Dez. 2011 (CET)
- Sollte man nicht noch einen Link auf Box-Muller-Methode als Hauptartikel einfügen? --Sigbert 18:36, 16. Dez. 2011 (CET)
- Der Link ist ja da (übersehen? oder reden wir von verschiedenen Absätzen? Normalverteilung#Box-Muller-Methode).
- Regelgerecht wäre die Formatierung mit der Hauptartikel-Vorlage, aber bei einer Zeile Text im Abschnitt unangebracht. – Rainald62 00:38, 17. Dez. 2011 (CET)
- Übersehen..., mea culpa. Trotzdem wäre die Hauptartikel-Vorlage sinnvoll. --Sigbert 11:10, 17. Dez. 2011 (CET)
- Sollte man nicht noch einen Link auf Box-Muller-Methode als Hauptartikel einfügen? --Sigbert 18:36, 16. Dez. 2011 (CET)
Sprache
Ich hätte anders wie im Artikel folgendes geschrieben:
Schätzer Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat\mu} für den Mittelwert und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat\sigma} für die Standardabweichung erhält man, ...
weil sonst den Satz so interpretiert werden kann dass Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat\mu} der Mittelwert ist und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat\sigma} die Standardabweichung. Nijdam 11:04, 30. Dez. 2011 (CET)
- Das ist nur wahr. Hab es ausgebessert. -- Plankton314 13:54, 30. Dez. 2011 (CET)
Neuer Abschnitt Parameterschätzung
... gehört m.E. nicht in diesen Artikel. – Rainald62 16:51, 28. Dez. 2011 (CET)
- Ich habe ihn aus dem Artikel Standardabweichung hierher verschoben, weil er m.E. dort ebenfalls nicht hingehört.
- Im englischen Wiki gibt es zur NV einen ähnlichen Abschnitt.
- Da hier speziell die Parameter der Normalverteilung geschätzt werden, passt es doch zum Thema? -- Plankton314 16:59, 28. Dez. 2011 (CET)
- Im Rinne (Taschenbuch der Statistik) werden für (fast) jede Verteilung Parameterschätzer (meist Likelihood, manchmal auch Kleinste-Quadrate) angegeben. Gehört meiner Ansicht also zu allen Verteilungen. --Sigbert 17:10, 28. Dez. 2011 (CET)
- Hmm. In welchen Artikel würde dann deiner Meinung nach dieser Abschnitt gehören?
- Ich habe versucht allgemeines über Parameterschätzer, Likelihood, etc. aus dem Abschnitt herauszuhalten. D. h. es dreht sich hier ausschließlich um die Normalverteilung. -- Plankton314 17:21, 28. Dez. 2011 (CET)
- Parameterschätzung leitet auf Konfidenzintervall weiter, wo (natürlich) auch Parameter der Normalverteilung geschätzt werden. – Rainald62 17:32, 28. Dez. 2011 (CET)
- Ja, das habe ich auch gesehen. Was allerdings Parameterschätzung mit Konfidenzintervall zu tun haben soll erschließt sich mir absolut nicht. Der beschriebene ML-Schätzer ist außerdem ein Punkt- und kein Intervallschätzer. Auch beschreibt er keine allgemeine stochastische Eigenschaft.
- Oder andersherum: ein interessierter Leser, der die Varianz seiner normalverteilten Stichprobe schätzen will, wird m.E. mit Sicherheit zuerst unter "Normalverteilung" nachlesen. Das ist hier.
- Ich kann leider immer noch nicht nachvollziehen, warum ein Abschnitt über die konkrete Schätzung der speziellen Parameter einer Normalverteilung in einen allgemeinen Artikel über Stochastik gehören sollte. -- Plankton314 17:48, 28. Dez. 2011 (CET)
- Also ich finde, dass der Abschnitt zur Parameterschätzung hier schon an der richtigen Stelle steht, da es ja potentiell für jede Verteilung eigene Schätzformeln gibt. Allerdings sieht es momentan so aus, als ob die 1/n-Version der Varianzschätzung die wichtigste (einzige?) Möglichkeit wäre. Das müsste man noch anders gewichten. -- HilberTraum 18:07, 28. Dez. 2011 (CET)
- Bei der Frage nach der Varianz der normalverteilten Grundgesamtheit aus einer Stichprobe würde ich Varianz eintippen und Varianzschätzung finden – oder Stichprobe tippen/Stichprobenvarianz finden. Ob Parameterschätzung unter Konfidenzintervall gut erklärt ist oder einen eigenen Artikel haben sollte, ist eine andere Frage. Das Problem, das ich hier habe: Es ist nicht "die" Parameterschätzung der Normalverteilung, sondern "eine". Es sieht so aus, als bräuchte man zur Parameterschätzung eine Stichprobe. – Rainald62 19:45, 28. Dez. 2011 (CET)
- Sorry, das ist falsch (oder ich verstehe dich falsch). Es ist "die" (ML-)Parameterschätzung der Normalverteilung in der dargestellten Form. ML-Schätzungen für andere Verteilungen sehen anders aus. -- Plankton314 20:37, 28. Dez. 2011 (CET)
- (BK) @Rainald62: Heißt das, du würdest vorschlagen, man sollte die Maximum-Likelihood-Schätzer für die Varianz von allen Verteilungen in den Artikel Varianzschätzung einbauen? Das würde doch hoffnungslos unübersichtlich. Und was, wenn man einen Schätzer für einen anderen Verteilungsparameter braucht? Wo sollte man den suchen? -- HilberTraum 20:43, 28. Dez. 2011 (CET)
- Das kann ich nur unterstreichen. Der Punkt ist, dass es hier nicht um die Schätzung der Varianz sondern der jeweiligen Verteilungsparameter geht (z. B. Rayleigh). Und die gehören m.E. definitiv zur entsprechenden Verteilung. -- Plankton314 21:13, 28. Dez. 2011 (CET)
- "Eine Schätzung" bezieht sich darauf, dass die meisten Schätzungen von Normalverteilungsparametern nicht nach der im Artikel dargestellten Methode vorgenommen werden. Falls z.B. meine Schwester mir mitteilt, sie habe einen neuen Freund, dann kann ich eine Verteilung für seine Körpergröße, sein Gewicht, sein Alter schätzen, obwohl die im Artikel dargestellte Methode nicht anwendbar ist. – Rainald62 04:33, 29. Dez. 2011 (CET)
- So ganz verstehe ich die Problematik bei deinem Schwesterbeispiel nicht. Außerdem handelt es sich dabei eher um ein Prognoseproblem, das nochmal etwas anderes ist. Aber wieso sollte die Methode aus dem Artikel für Größe, Gewicht und Alter nicht anwendbar sein? Wenn die letzten 30 Freunde deiner Schwester beispielsweise alles untersetzte ältere Herrn waren, kannst du mit der Formel ausrechnen, dass die Varianz bei ihren Freunden eher klein ist ;-) -- HilberTraum 09:50, 29. Dez. 2011 (CET)
- ... vorausgesetzt, ich habe von allen 30 Größe, Gewicht und Alter genannt bekommen. Wie wende ich die Formel im Artikel an, falls ich zusätzlich das Alter des neuen genannt bekomme? Und unternehme ich etwa keine Parameterschätzungen, wenn der untersetzte ältere Herr vor mir steht? – Rainald62 13:49, 29. Dez. 2011 (CET)
- So ganz verstehe ich die Problematik bei deinem Schwesterbeispiel nicht. Außerdem handelt es sich dabei eher um ein Prognoseproblem, das nochmal etwas anderes ist. Aber wieso sollte die Methode aus dem Artikel für Größe, Gewicht und Alter nicht anwendbar sein? Wenn die letzten 30 Freunde deiner Schwester beispielsweise alles untersetzte ältere Herrn waren, kannst du mit der Formel ausrechnen, dass die Varianz bei ihren Freunden eher klein ist ;-) -- HilberTraum 09:50, 29. Dez. 2011 (CET)
- Da wirfst du aber verschiedene Fragestellungen durcheinander. Wenn du von einem Parameter (Alter) auf einen anderen (Größe) schließen willst, braucht du eine Regression (wobei du aber wohl nur bei den minderjährigen Freunden der Schwester einen deutlichen Zusammenhang zwischen beiden Parametern erwarten kannst). Wenn der Freund schon vor dir steht, hast eigentlich keine Schätzung mehr im Sinne der Statistik, sondern nur noch im umgangssprachlichen Sinn, also eher eine (ungenaue) Messung. Denn das Alter eines ganz bestimmten Mannes ist ja nicht "zufällig", kommt also nicht aus einer Verteilung, sondern ist dir nur unbekannt. -- HilberTraum 15:05, 29. Dez. 2011 (CET)+
- Ich werfe nichts durcheinander, sondern dir Scheuklappensicht und Statistiker-Slang vor ("kommt aus einer Verteilung"). Es ist nicht alles Statistik und Zufall. Die Unsicherheit einer Einzelmessung lässt sich als Wahrscheinlichkeitsverteilung für die Messgröße ausdrücken. – Rainald62 16:02, 29. Dez. 2011 (CET)
- :-D Okay, jetzt wirds hier langsam schon sehr... sagen wir mal: lustig.
- Nachdem der Austausch fachlicher Argumente nun wohl beendet ist, können wir das Fazit ziehen, dass keine schlüssigen Argumente für eine Verlagerung des Abschnitts aufgeführt wurden und er somit bleibt wo er steht. -- Plankton314 16:26, 29. Dez. 2011 (CET)
- Och menno, dabei waren wir niveaumäßig noch gar nicht bei den "Deine Schwester!"-Witzen angekommen. (scnr) -- HilberTraum 18:17, 29. Dez. 2011 (CET)
Ich finde es sinnvoll, dass irgendwo in der Wikipedia auf die Parameterschätzung der Normalverteilung eingegangen wird, und dass man von diesem Artikel sehr leicht und auf offensichtliche Art und Weise aus zu dieser Information hingelangt. Wenn es nun so wäre, dass alle Wahrscheinlichkeitsverteilungen als Parameter µ und σ hätten, dann wäre der Abschnitt zur Parameterschätzung vielleicht wirklich besser woanders aufgehoben. Aber natürlich ist das nicht so. Und es ist umgekehrt für jede Verteilung (nicht nur die Normalverteilung) für den Leser durchaus von Interesse, wie man aus einer Reihe von Messwerten die Parameter einer mutmaßlich zugrundeliegenden Verteilung abschätzen kann.
Was das Beispiel mit dem Alter eines einzigen Freundes aussagen soll, erschließt sich mir leider nicht – aus einem einzigen Messwert (Statistiker-Slang: einer Stichprobe mit einem Umfang von 1) kann man nun einmal keine sinnvolle Varianz schätzen (bzw. man könnte sie natürlich auf 0 schätzen und sich genauso schelmisch darüber freuen wie über das perfekte R²=1, welches man erhält, wenn man eine Regression auf nur zwei Datenpunkten durchführt…;-) --Wutzofant (grunz) 20:51, 29. Dez. 2011 (CET)
- Mit einem Messwert hat es garnichts zu tun, wenn dir eine fremde Person erstmals gegenübersteht. Eine Grundgesamtheit gibt es nicht. Trotzdem wirst Du vom bloßen Ansehen ihr Alter schätzen können. Bei der Vielzahl der Einflüsse, die den Eindruck des Alters beeinflussen, wirst Du (bei entsprechender Vorbildung) von einer Normalverteilung ausgehen und (mit etwas Erfahrung) dein Gefühl der Unsicherheit in eine Varianz übersetzen können. Das Ergebnis ist eine Wahrscheinlichkeitsverteilung (bitte den ersten Satz der Einleitung beachten) für das Alter der Person. – Rainald62 21:22, 29. Dez. 2011 (CET)
- @Plankton314: Wenn Du meine Argumente nicht schlüssig findest und meine Einleitung zum Abschnitt nicht korrekt, dann wirst Du sicher sagen können, wo mein Trugschluss liegt und was an der Einleitung falsch ist. – Rainald62 00:25, 30. Dez. 2011 (CET)
- Wie im Revert beschrieben, finde ich deinen Text etwas unscharf.
- Du schreibst "Manchmal ist über eine Verteilung nichts weiter bekannt als die Werte einer Stichprobe", es ist jedoch nicht die Verteilung die interessiert, sondern das erzeugende System. Eine Verteilung kann ja keine Werte generieren sondern ist nur eine Eigenschaft einer Zufallsvariable. (Ich verstehe (glaube ich) schon was du ausdrücken willst, aber darum finde es ich unscharf.) Außerdem muss ja weiterhin bekannt sein, dass sie einer Normalverteilung genügt, also ist doch mehr bekannt als die bloße Stichprobe. In der Praxis ist das auch nicht nur "manchmal" sondern "meistens".
- Weiterhin ist es nicht zwingend, dass die Grundgesamtheit normalverteilt ist (es genügt, wenn die ZV innerhalb des Beobachtungszeitraumes stationär ist).
- Und das vorherige Beispiel mit den Messwerten halte ich für praxisnah.
- Das ist jetzt natürlich nicht die absolute Wahrheit sondern erstmal meine Meinung (da mag es auch noch andere geben ;) ). -- Plankton314 00:45, 30. Dez. 2011 (CET)
- Es geht laut Abschnittsüberschrift um die Parameter der Verteilung, aber die Verteilung interessiert eigentlich nicht – interessante Meinung.
- Zu meinen Argumenten hier hast Du noch garnichts gesagt (außer 'lustig'). Was Du sonst gesagt hast, passt jedenfalls nicht auf das Beispiel. Was ist etwa das erzeugende System in meinem letzten Beispiel? Was für Werte sollten da generiert werden? – Rainald62 01:09, 30. Dez. 2011 (CET)
- Ich finde dein obiges Schwester-Beispiel zu komplex/konfus. Wie HilberTraum bereits treffend feststellte, vermischt du m.E. hier Prognose, Messung, mehrdimensionale Verteilung, etc.
- Und nach dem dir HilberTraum auf dein Altersbeispiel geantwortet hat, kamen auf einmal noch weitere Attribute/Parameter hinzu von denen du dann behauptet hast, du könntest sie nicht genau messen.
- Außerdem hab ich oben gemeint, dass nicht "über eine Verteilung" nichts bekannt ist sondern über die Verteilung des (erzeugenden) Systems. Über die Normalverteilung ist alles bekannt (okay, außer ihrer exakten Stammfunktion). -- Plankton314 14:27, 30. Dez. 2011 (CET)
- Warum willst Du unbedingt die Anwendung der Normalverteilung auf die Statistik einengen? Das Nicht-genau-messen-Können ist doch kein Grund wegzuschauen, sondern gerade der Prototyp für Situationen, in denen glockenförmige Wahrscheinlichkeitsverteilungen auftreten. – Rainald62 15:33, 30. Dez. 2011 (CET)
Inhaltliche Diskussion zu diesem Abschnitt
Bislang steht im Artikel eigentlich nur drin: "Man kann einfach arithmetisches Mittel und Stichprobenvarianz ausrechnen und das als Parameter einsetzen. Man kann aber auch einen Riesen-Bohei mit Max-Likelihood veranstalten." Aber was ist denn der Vorteil der Likelihood-Schätzung gegenüber dem naiven Ansatz? Ehrliche, ernstgemeinte Frage – denn im Endeffekt kommt bei der ganzen Rechnerei doch nur heraus, dass man auch hier arithmetisches Mittel und (unkorrigierte) Stichprobenvarianz herausbekommt. Könnte man das nicht evtl. ein wenig abkürzen, so à la "Wenn man Max-Likelihood anwendet, kommt man ebenfalls auf diese Formeln", ggf. noch mit Hinweis auf korrigierte vs. unkorrigierte Stichprobenvarianz. Momentan sieht es oberflächlich betracht so aus, als ob es zwei verschiedene Methoden wären (daher habe ich auch eine weitere Überschrift eingefügt). --Wutzofant (grunz) 20:51, 29. Dez. 2011 (CET)
- Jepp, das ist eine berechtigte Frage und die hab ich mir ehrlich gesagt anfangs genauso gestellt. Ich hoffe, ich kann das hier sinnvoll an einem Beispiel belegen (ansonsten kommt mir vllt. HilberTraum zu Hilfe).
- Zugegeben, dass ist ein dummes Beispiel, weil nämlich einfach nur arith. Mittel und StiPro-Varianz rauskommen. Wendet man die ML-Methode jedoch auf andere Verteilungen an, kommen hier auch andere Schätzer heraus. Z. B. bei der Exponential-Verteilung oder der Log-Normal-Verteilung.
- Siehe hierzu auch im Rinne, Taschenbuch der Statistik, S. 308 unten, ML-Schätzer für Log-Normalverteilung.
- Die Antwortet auf deine Frage lautet also, dass ein ML-Schätzer, anders als die naive Methode, für eine bestimmte Verteilung angepasst ist.
- Hoffe das hilft... -- Plankton314 00:01, 30. Dez. 2011 (CET)
- Vielleicht kann man die Herleitung des ML-Varianz-Schätzers kürzen (als Beispiel ist diese zwar interessant, steht aber schon im Artikel Maximum-Likelihood-Schätzung). "Erwartungstreu" und "Max-Likelihood" haben m.E. beide ihre Berechtigung, daher ist es schon sinnvoll, wenn man aufzeigt, welcher Schätzer die eine und welcher die andere Eigenschaft hat. Ein Kollege von mir hat mal die Parameter geschätzt, indem er die Funktionsgleichung logarithmiert und dann für die resultierende quadratische Gleichung eine lineare Regression durchgeführt hat. So sollte man es natürlich nicht tun. --Zipferlak 10:30, 30. Dez. 2011 (CET)
- Oh je. Das scheint ja wirklich ein sehr beliebtes Beispiel zu sein. Bei Varianzschätzung steht es ebenfalls.
- Da stimme mich Zipferlak zu, eine gekürzte Beschreibung hier im Artikel genügt wohl. Und ich füge mal einen Redundanz-Baustein bei Varianzschätzung#Varianzschätzung einer normal-verteilten Grundgesamtheit ein. -- Plankton314 14:04, 30. Dez. 2011 (CET)
- Ich habe jetzt mal den Abschnitt noch etwas umformuliert und umgestellt, so dass die beiden Teile besser verbunden sind. Meiner Meinung nach ist der Abschnitt insgesamt schon recht gut geworden. -- HilberTraum 16:33, 30. Dez. 2011 (CET)
Im Text lautet es: ... indem die Log-Likelihood-Funktion für die Normalverteilung maximiert wird. Logischerweise muesste da stehen: ... indem die Likelihood-Funktion, oder glechwertig(deutsch?) die Log-Likelihood-Funktion für die Normalverteilung maximiert wird.Nijdam 15:56, 31. Dez. 2011 (CET)
- Ist das so gemeint?: ... indem die Likelihood-Funktion maximiert wird. Für die Normalverteilung gleichwertig ist die Maximierung der Log-Likelihood-Funktion. – Rainald62 22:34, 31. Dez. 2011 (CET)
- Ich weiß nicht wie es gemeint ist, aber den Max-Likelihood-Schätzer findet man wenn man die Likelihood-Funktion maximiert. Weil aber die Log-Funktion monoton wachsend ist, kann man auch die Log-Likelihood-Funktion maximieren. Das meinte ich jedenfalls. Nijdam 17:04, 1. Jan. 2012 (CET)
- Eigentlich könnte dieser Nebensatz jetzt, wo die Rechnung nicht mehr drin ist, auch raus, oder? -- HilberTraum 16:26, 1. Jan. 2012 (CET)
- Meine ich auch. Nijdam 17:37, 1. Jan. 2012 (CET)
- Wie Nijdam bereits feststellte, kann man statt der Likelihood- auch die Log-Likelihood-Funktion maximieren. Das läuft zwar letztenendes auf die gleiche Lösung raus, oftmals ist aber die Log-Likelihood leichter analytisch zu lösen, weil sich dann Logarithmus und Exponentialfunktion aufheben. Es ist jetzt sicherlich kein kritischer Schritt, ich fände es aber nützlich das kurz irgendwo zu erwähnen. Das könnte aber sinnvoller im Artikel Maximum-Likelihood-Methode stehen, wo auch die Herleitung beschrieben ist. -- Plankton314 19:27, 1. Jan. 2012 (CET)
Gauß?
Hallo,
ich bin etwas verwirrt darüber, dass die Funktion bzw. dessen (Glocken-)Kurve nach Gauß benannt wird, aber dieser im Abschnitt "Geschichte" nicht einmal genannt wird... Warum heißt die denn so, wenn sie nix mit Gauß zu tun hat? Oder hat sie doch? Dann sollte das doch da stehen...
Gruß, --Stabacs 14:06, 19. Jan. 2012 (CET)
- Da steht doch Im Jahr 1809 publizierte Gauß sein Werk ... die Normalverteilung definiert.? --Sigbert 07:53, 21. Jan. 2012 (CET)
- Ach ja, da stehts ja. Sorry, war ich wohl etwas blind. ;)
--Stabacs 00:59, 27. Jan. 2012 (CET)
Fouriertransformation der Gaußfunktion
Es fehlt die Fouriertransformation der Gaußfunktion, welche wieder eine Gaußfunktion ergibt: Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \int_{-\infty}^{\infty} \frac{1}{\sqrt{\pi a}} e^{-\frac{t-t_0}{a}}e^{-i\omega t}dt = e^{-(i\omega t_0 +a{\frac{\omega}{2}}^2)}} . (nicht signierter Beitrag von 91.21.124.65 (Diskussion | Beiträge) 20:27, 22. Feb. 2010 (CET))
- gudn tach!
- im abschnitt Normalverteilung#Invarianz gegenüber Faltung wird dieses thema angesprochen. sollte genuegen, oder? -- seth 20:25, 25. Mär. 2012 (CEST)
Bildunterschrift stimmt nicht mit Bild überein
Kann es sein, daß das erste Bild in keinster Weise mit dessen Unterschrift übereinstimmt? Die blaue Kurve/Verteilung soll durch N(0,1) definiert sein. Egal wie man das Komma in der Argumentliste der N-Funktion interpretiert, es stimmt nicht mit der Abbildung überein. Entweder Interpretiere ich das "," als Dezimaltrennzeichen (wäre nach Standard in Europa vernüpftig), dann sollte sich m.E. das Maximum der Kurve bei "0.1" (Im Bild) mit der Ordinatenachse schneiden; oder ich interpretiere das "," als Trennzeichen der Argumentliste (was wohl gemeint ist), dann sollte sich das besagte Maximum eben bei "1.0" befinden.
Oder sehe ich da was falsch?
-- Wasp-edia (Diskussion) 16:57, 28. Mär. 2012 (CEST)
- Die Bezeichnungen sind wie im Abschnitt "Definition", also vor dem Komma der Erwartungswert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu} und nach dem Komma die Varianz Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2} . Soweit ich sehe müsste also die Bildunterschrift schon stimmen, oder? -- HilberTraum (Diskussion) 18:09, 28. Mär. 2012 (CEST)
- Ja, die Bildunterschriften stimmen. Warum, steht hier und hier. -- Plankton314 (Diskussion) 20:40, 28. Mär. 2012 (CEST)
Plot Verteilungsfunktion
Ist es eigentlich so schwierig einen einfachen Plot der Verteilungsfunktion einzufügen? Wie eine Gauss-Glocke aussieht weiß wohl jeder, aber davon haben wir unzählige Plots im Artikel. Die englischen Kollegen haben das direkt am Seitenanfang drin: http://en.wikipedia.org/wiki/Normal_distribution (nicht signierter Beitrag von 80.218.67.175 (Diskussion) 21:37, 13. Mai 2012 (CEST))
- Im aktuellen Artikel scheinen nahezu die gleichen Bilder verwendet zu werden. Daher ist das hier wohl erledigt. --Martin Thoma 21:40, 29. Aug. 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Martin Thoma 21:40, 29. Aug. 2014 (CEST)
Bild
Hallo zusammen,
ich würde gerne
durch
ersetzen. Das neue Bild hat keinen weißen Hintergrund und die Einträge in der Legende sind ausgerichtet und würde deshalb im Artikel besser aussehen.
Gibt es Einwände oder Verbesserungsvorschläge? Grüße, --Martin Thoma 06:46, 10. Aug. 2014 (CEST)
- Wenn ich explizit nach Nörgeleien gefragt werde: bei der Größe ist die Legende im bisherigen Bild besser lesbar. Gruß, Kronf @ 18:59, 10. Aug. 2014 (CEST)
- Konstruktives Nörgeln wird gerne gesehen :-)
- Ich habe die Legendeneinträge nun auch serifenfrei gemacht und deren Schriftgröße deutlich erhöht. Ist es nun gut lesbar? --Martin Thoma 14:54, 11. Aug. 2014 (CEST)
- Danke, sehr schön jetzt! --Kronf @ 19:47, 13. Aug. 2014 (CEST)
- Danke :-) Ich habe es nun im Artikel ersetzt. --Martin Thoma 20:55, 14. Aug. 2014 (CEST)
- Danke, sehr schön jetzt! --Kronf @ 19:47, 13. Aug. 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Martin Thoma 21:26, 29. Aug. 2014 (CEST)
Dichtefunktion blau
Ich wollte immer schon wissen, ob phi(x) /Dichtheitskurve größer 1 sein kann. Für kleine sigma/Standardabweichung ist das möglich. Keine der Beispielkurven hat ein genügend kleine Standardabweichung, sodass der Eindruck entsteht, die Dichtheitskurve phi hat ein Maximum kleiner als 1 wie die Verteilungsfunktion Phi. Das stimmt nicht... --JackPilot (Diskussion) 15:41, 7. Dez. 2017 (CET) Eine Varianz mit 4 wäre als Darstellung auch besser, da die Wendestellen bei -2 und 2 einzeichenbar wären. Eine Varianz mit 1 hat ja die Wendestellen bei -1 und 1.
- Du meinst sicher die Dichtefunktionen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle f}
von Normalverteilungen: Sie können (bei hinreichend kleiner Varianz) sogar beliebig große Werte annehmen.
Betrachte zum Beispiel die Stelle Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x=\mu:}- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle f(\mu) = \frac {1}{\sqrt{2\pi\sigma^2}}}
- Für Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2 < 1/2\pi \approx 0{,}159 } wird Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle f(\mu)} offenbar größer als 1.
- Gruß, Franz 00:06, 4. Jan. 2018 (CET)
- Korrekt, ich meine die Dichtefunktion.
- Weiters stimmt deine Rechnung, es ist nicht 4, sondern 1/4, bzw. dein genauerer Wert, wo die Wendestellen dann größer 1 werden. Das \cdot a habe ich gestrichen, oder hatte das eine Bedeutung, das habe ich sonst nirgendwo in der Dichtefunktion gefunden?--JackPilot (Diskussion) 16:38, 10. Jan. 2018 (CET)
- Ja, das „\cdot a“ habe ich zu löschen vergessen: Ich wollte wohl ursprünglich (um mein „beliebig große Werte“ zu begründen) so etwas wie
- „Für Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma < 1/(\sqrt{2\pi} \cdot a) \approx 0{,}3989/a} wird Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle f(\mu)} offenbar größer als a“
- schreiben, um darzulegen, daß bei Wahl einer hinreichend kleinen Varianz Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle f(\mu)} nicht nur 1 überschreiten kann, sondern auch jede (noch so große) Zahl Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle a} . Dann habe ich aber wieder Abstand davon genommen, weil mir die Beschränkung auf das von Dir angefragte Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle a=1} sinnvoller zu sein schien.
- Franz 00:28, 11. Jan. 2018 (CET)
- Ja, das „\cdot a“ habe ich zu löschen vergessen: Ich wollte wohl ursprünglich (um mein „beliebig große Werte“ zu begründen) so etwas wie
- Ganz so tief bin ich nicht, dass mit a habe ich nicht weiterverfolgt.
- Für die Visualisierung, wenn Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2 = 1/2\pi \approx 0{,}159: }
. Die Wendestellen und deren Werte Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu-\sigma}
und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle f(\mu-\sigma)}
sind weder Ganzzahlen noch ganzzahlige Brüche, nur f(Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu }
) =1. Für die Visualisierung ist daher vermutlich Varianz 1/16 bzw. 1/4 als Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma }
und einen entsprechend hohen Wert f(Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu }
) über 1 anschaulich...--JackPilot (Diskussion) 11:19, 11. Jan. 2018 (CET)
- Inzwischen gibt es im Abschnitt ==Normierung== eine Animation dazu. Also erledigt. --Rainald62 (Diskussion) 20:28, 23. Mär. 2021 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: Rainald62 (Diskussion) 20:28, 23. Mär. 2021 (CET)