Diskussion:Mehrdimensionale Normalverteilung

aus Wikipedia, der freien Enzyklopädie

Korrekte Auslagerung (20.11.-11.12.2009)

Diese Auslagerung ist eine Urheberrechtsverletzung. Das Meiste daraus stammt von mir und das soll jetzt nicht mehr wahr sein? Ich hätte wenigstens erwartet, dass das in der Zusammenfassungszeile erwähnt wird. -- Philipendula 08:59, 20. Nov. 2009 (CET)

Ist schon auf WP:A/A angesprochen, hat sich aber keiner drum gekümmert. Kannst gerne Druck machen, damit es gelöst wird. -- XenonX3 - (:±) 09:02, 20. Nov. 2009 (CET)
Ah, danke. Na dann mal los. -- Philipendula 09:27, 20. Nov. 2009 (CET)
Hallo, den neuen Artikel ohne Mitnahme der Historie zu erstellen, war nicht meine Absicht (ich wusste nur nicht Bescheid über die verschiedenen Möglichkeiten, einen neuen Artikel zu beginnen, habe jetzt die Hilfeseite gelesen). Ich schlage vor, dass ein Administrator die Abschnitte über die mehrdimensionale Normalverteilung jetzt so auslagert, dass die Historie dabei ist. Prinzipiell hat wohl niemand etwas dagegen, einen eigenen Artikel zu diesem Thema zu haben. Siehe auch die Diskussionsseite von Philipendula. Mit der Bitte um Nachsicht KurtSchwitters 13:10, 21. Nov. 2009 (CET)

Also das Wissen über eine mehrdimensionale Normalverteilung gehört zum Standartwissen jedes Studenten der sich ein bißchen tiefer mit Statistik beschäftigt, ist quasi Allgemeinwissen. Ich könnte die zugehörige Formel hier, wenn ich Zeit hätte wieder einstellen ohne Quellenangaben liefern zu können. Meiner Meinung ist, wenn man hier Urheberrechte einfordert, dann kann man auch zu "Im Frühtau zu Berge" oder "Alle Vögel sind schon da" Urheberrechte einfordern. Völliger Blödsinn. Für andere die das nicht Wissen, die wären daran denke ich aber sehr interessiert etwas über die Mehrdimensionale Normalverteilung zu erfahren. Also sofort wieder freischalten, und von mir aus nennt da einen Autor. -- 134.76.55.100 12:22, 24. Nov. 2009 (CET)

Auch wenn ich ein Lehrbuch über Grundlagen der Statistik schreibe und ich alles aus Kopf weiß, habe ich einen Urheberrechtsschutz. Das ist nun mal nach dem Gesetz so, auch wenn schlecht gelaunte IPs anders drüber denken. Außerdem gehört Rechtschreibung ebenfalls dazu. -- Philipendula 13:00, 24. Nov. 2009 (CET)
Hallo Philipendula, kannst Du die Auslagerung mit Historie machen? -- KurtSchwitters 21:11, 2. Dez. 2009 (CET)

Weitere Diskussionsanregungen

  • Die Konvention, dass mehrdimensionale Zufallsvariablen klein und unterstrichen geschrieben werden, halte ich für überflüssig und entspricht auch nicht der Verwendung im Artikel Zufallsvariable.
  • Da man bei der mehrdimensionalen Normalverteilung mit singulärer Kovarianzmatrix keine Dichte hat, muss der Abschnitt anders formuliert werden. Entweder lässt man solche Fälle nicht zu und nimmt die Dichte als Definition, oder man muss die Definition anders machen, z.B. "jede Linearkombination der Komponenten ist normalverteilt", siehe die englische Fassung des Artikels über die mehrdimensionalen Normalverteilung.
  • Das Beispiel Apfelbaumplantage: hier fände ich es angebracht, auf den Unterschied von Modell und zu modellierender Realität hinzuweisen. Beispielsweise sind Größe und Ertrag stetige Werte, während Anzahl der Blätter erstmal ein diskretes Merkmal ist. Bei der Anzahl der Blätter soll der Mittelwert 20000 sein und die Standardabweichung 15000. Da die Blattanzahl nicht negativ werden kann, müsste man also eine "abgeschnittene Normalverteilung" postulieren. Das lässt sich natürlich durch Änderung der Parameter beheben, macht aber klar, warum ich hier Vorbehalte habe.
  • Die Fortführung des Beispiels wäre wohl besser in einem Artikel aufgehoben, in dem auch auf Schätzer eingegangen wird, da hier ja diese Schätzer ausgerechnet werden.

-- zitiere_kinsey 20:51, 12. Nov. 2009 (CET)

Überarbeitung

Ich schlage vor, die Verwendung der Schreibweise mit Unterstrich auf statistische Artikel zu beschränken, z.B. wie in Hauptkomponentenanalyse. Wenn es um Begriffe der Wahrscheinlichkeitstheorie geht, würde ich gerne X für Zufallsvariablen nehmen (oder einen anderen Großbuchstaben ohne Unterstrich), egal, ob sie reellwertig sind oder in einen anderen Raum gehen. Im mehrdimensionalen Fall kann man dann schreiben, und wenn es um die statistische Analyse mehrdimensionaler Daten geht, kann man übergehen zu . -- zitiere_kinsey 17:38, 22. Nov. 2009 (CET)

Ein paar Fragen

Hallo, ich hoffe, die Fragen sind nicht zu blöd, aber ein paar Punkte in dem Artikel sind mir einfach nicht ganz klar:

1. Standarisierung: ist mit gemeint, dass

a) zuerst die Inverse der Kovarianzmatrix gebildet wird und dann die Wurzel aus dem Ergebnis gezogen wird

b) zuerst die Wurzel gezogen und dann die Inverse gebildet wird

c) a) und b) gleich sind

d) etwas ganz anderes damit gemeint ist

2. Im Abschnitt „Die Dichte der zweidimensionalen Normalverteilung“ wird einmal ϱ und einmal ρ benutzt. Gibt es dafür einen bestimmten Grund?

--Sepp 16:10, 24. Nov. 2010 (CET)

Hallo, wenn eine Matrix invertierbar ist, dann ist die inverse Matrix eindeutig. Das gilt nicht für Quadratwurzeln. Für diese gibt es mehrere Möglichkeiten; für jede dieser Möglichkeiten ist die angegeben Eigenschaft richtig (dafür sollten wir noch eine Referenz angeben). Ob man zuerst eine Wurzel nimmt und diese invertiert, oder eine Wurzel der Inversen nimmt, ist egal (es kommt aber nicht unbedingt das gleich heraus). Zu 2): sollte man vereinheitlichen. Es ist in beiden Zeilen der gleiche Korrelationskoeffizient gemeint. -- KurtSchwitters 09:17, 25. Nov. 2010 (CET)

Danke für die Antworten. Ich habe ρ in dem Artikel überall zu ϱ geändert, diese Variante wird auch in dem Artikel Korrelationskoeffizient verwendet. --Sepp 13:08, 25. Nov. 2010 (CET)

Hallo, für die Eindeutigkeit siehe auch Quadratwurzel#Quadratwurzeln_aus_Matrizen. Man muss unterscheiden, ob man eine Matrix A mit sucht, oder mit . Die Matrix A ist wohl dann eindeutig, wenn man verlangt, dass A symmetrisch ist ( soll natürlich positiv definit und symmetrisch sein). -- KurtSchwitters 13:32, 7. Dez. 2010 (CET)

Degenerierte multivariate Normalverteilung

Der Artikel sollte Definitionen anpassen, so dass auch nicht-invertierbare Kovarianzmatrizen erfasst werden können, oder?--Erzbischof 13:27, 14. Jan. 2012 (CET)

Nicht ganz klar, ob man es tun sollte, da aufgrund fehlender Dichte insgesamt schwerer verständlich. In der englischsprachigen WP gibt es dazu den Abschnitt „Degenerate Case“. Bitte zum Vergleich dort mal lesen. -- KurtSchwitters 13:15, 16. Jan. 2012 (CET)

Bild

Ich habe mal wieder eine Vektorversion erstellt:

Gibt es Anmerkungen?

Das neue Bild hat nur noch 5.000 (keine 10.000) Samples, da sonst LaTeX abschmiert. --Martin Thoma 17:02, 8. Sep. 2015 (CEST)

Beispiel Rechnung

Wie kommt man in dem Beispiel (Blätter, Ertrag, Höhe) auf die Werte für die Kovarianz und Korrelationskoeffizienten? Wenn das berechnete Werte sind, wäre es gut eine Berechnung daneben zu schreiben. Wenn das einfach gewählte Beispielwerte sind, dann sollte das deutlicher aus dem Text hervorgehen. (nicht signierter Beitrag von 2A01:5C0:1A:2391:D4C6:7785:FDA3:8F4 (Diskussion | Beiträge) 22:23, 15. Nov. 2015 (CET))

"affine" statt "lineare" Transformation?

Y=a+BX wird im Artikel als "lineare Transformation" bezeichnet, mit Link auf den Artikel über lineare Abbildungen. Für a!=0 ist die Homogenitätseigenschaft aber nicht erfüllt und es handelt sich dann nicht um eine lineare Abbildung. Ist der Begriff "lineare Transformation" weniger streng definiert als "lineare Abbildung"? Wenn ja, würde ich zumindest vorschlagen, hier auf den Artikel über affine Abbildungen zu verlinken.

Du hast recht. Egal wie allgemein man linear definiert (z.B. incl affin-linear), affin ist definitiv präziser. Danke für den Hinweis, ich habs geändert. --NikelsenH (Diskussion) 19:12, 11. Mai 2016 (CEST)

Mehrdimensionale Normalverteilung vs. Multivariate Normalverteilung

Waere es nicht besser, konsequent an einer der beiden Bezeichnungen festzuhalten? Gruss --Sandro M. Roch (Diskussion) 12:00, 27. Sep. 2017 (CEST)

allgemeiner Fall

Hier wird ein t eingeführt, warum? ist t=x vom obigen Abschnitt oder t=x-µ? Ich fände es besser, nach Möglichkeit nur die obigen Variablen zu verwenden.--2003:A:1517:8900:29ED:46C6:498F:D586 13:32, 23. Mai 2019 (CEST)

Streuung

Schön, dass nun Angaben zur Streuung hier zu finden sind. Vielleicht können ja noch die Formeln zur Berechnung der Prozente als Funktion von und zurück auch wieder dazu.--M.J. (Diskussion) 21:21, 5. Jul. 2020 (CEST)

Danke für deine Aufmerksamkeit, die Formeln wieder zu reaktivieren. Vielleicht wäre es aber noch gut, die Notation der Integrale zu erklären. Ein Integral bis r=1sigma, r=2sigma,... meint das Integral bis zur (mehrdimensionalen) 1-fachen, 2-fachen ... Standardabweichungsellipse durchzuführen. Auch die Funktionaldeterminante r'^{p-1} wäre besser erklärt. Hast du eine Idee, wie man das am Besten darstellt? biggerj1 (Diskussion) 01:20, 21. Jul. 2020 (CEST)
Ich habe das Vorgehen jetzt mit einer Hauptachsentransformation und Normierung beschrieben, für eine Funktionaldeterminante bin ich nicht Mathematiker genug.--M.J. (Diskussion) 23:09, 21. Jul. 2020 (CEST)

Parametrisierung der Kovarianzellipse

Was ist das Ziel von diesem Abschnitt? Soweit ich ihn verstehe, halte ich ihn für überflüssig und teilweise falsch.

Das eine Hauptachsentransformation eine Vereinfachung bringt, wird im Abschnitt zuvor schon vorausgesetzt und auch hier dann postuliert, ohne zu sagen, worin die Vereinfachung besteht. Die Variablenbenamung stimmt nicht mit dem vorhergehenden überein. Es ist auf drei Dimensionen beschränkt (warum nicht zwei, warum nicht n?). Ein "Vertauschen der Halbachsen" ist etwas anderes, als deren Kehrwert zu nehmen. Wenn man das macht, würde ich das Ergebnis vielleicht "Ellipsoid konstanter Wahrscheinlichkeitsdichte" nennen und nicht "Konzentrationsellipsoid". Kann der Absatz gelöscht werden, oder gibt es Fürsprecher, die ihn so formulieren können, dass man Gewinn daraus ziehen kann? Im Moment favorisiere ich löschen, weil mir für letzteres eben das Erklärungsziel fehlt. --M.J. (Diskussion) 22:21, 3. Sep. 2021 (CEST)

Hiermit gelöscht.--M.J. (Diskussion) 23:30, 10. Sep. 2021 (CEST)

symmetrisch?

Im Artikel wird nur gefordert, dass positiv semidefinit ist (positiv definit, wenn eine Lebesgue-Dichte existieren soll). Nach unserem Artikel Definitheit ist es auch nicht-symmetrischen Matrizen möglich, positiv (semi-)definit zu sein (siehe insbesondere Definitheit#Symmetrischer Anteil bei allgemeinen Matrizen). Im hiesigen Artikel wird von Symmetrie von hingegen nur im Abschnitt Erzeugung mehrdimensionaler, normalverteilter Zufallszahlen gesprochen. Muss im Allgemeinen symmetrisch sein oder sind auch nicht-symmetrische Matrizen erlaubt? --2A02:8108:50BF:C694:F040:2AF6:F56E:D13E 17:04, 4. Aug. 2022 (CEST)

muss symmetrisch sein. --Tensorproduct (Diskussion) 17:14, 4. Aug. 2022 (CEST)