Diskussion:Punktbiseriale Korrelation
P-B in Statistiksoftware
Aufmerksame Lesende (die das richtige Korrelationsmaß suchen) werden die Option nirgendwo in gängiger Software finden.
Da gerne immer auf die Statistiksoftware (blind) vertraut wird, ist der Anwendungsteil glaube ich relevant. Ein korrektes Zusammenhangsmaß zw. einer metrischen und einer binären/dichotomen Variable ist die punktbiseriale Korrelation -- in Software also "Produkt-Moment nach Pearson". Entweder stellt die Software jeweils automatisch um, oder die zugrundeliegende Formel ist eine (mathematisch) generelle Funktion, die Produkt-Moment und p-biserial beide richtig berechnet. Stichwortartig, da ein wenig Protokoll an mich selbst! Diceypoo (Diskussion) 15:14, 21. Mai 2017 (CEST)
Der bisherige Text (26.3.20) ist fehlerhaft!
Es müssen nicht die Standardabweichungen, sondern die empirischen Standardabweichungen (also die Schätzungen der Standardabweichungen, oft: Sigma quer) verwendet werden. Deshalb sind die Formeln mit P und Q falsch.
Es muss heißen ((MY1-MY0)*sigma(X)/sigma(Y) wird geschätzt durch ((MY1-MY0)*sigmaquer(X)/sigmaquer(Y) mit sigmaquer(X)=sqrt( (H/n-1)*(1-H/n))=sqrt((H-H^2/n)/n-1), wobei H= Summe(xi) die Anzahl der 1 bei X ist und n die Anzahl der Werte bei X und Y. P ist also H/(n-1) und Q ist 1-H/n. Oder man ersetzt PQ duruch (n/(n-1))PQ. Sonst ist der Wert der geschätzten punkt-biserialen Korrelation nicht gleich der Pearson-Korrelation. Die bisherige Formel hat damit zwei Fehler: Sie vermischt erstens geschätzte und wahrscheinlichkeitstheoretische Werte und gibt zweitens keine korrekten Formeln für die geschätzte Standardabweichung von X an. (nicht signierter Beitrag von Christian Eshaf (Diskussion | Beiträge) 09:37, 26. Mär. 2020 (CET))
- Ich hoffe, meine jüngste Bearbeitung löst das Problem. -- Nescimus (Diskussion) 16:46, 2. Mai 2020 (CEST)