Punktbiseriale Korrelation
Als punktbiseriale Korrelation wird der Korrelationskoeffizient für den Zusammenhang zwischen einem intervallskalierten Merkmal und einem dichotomen (bernoulliverteilten) Merkmal bezeichnet. Es handelt sich nicht um eine eigenständige Maßzahl, sondern um einen Spezialfall des gewöhnlichen Korrelationskoeffizienten nach Pearson, der in diesem Fall berechnet werden kann als
- ,
wobei die Quadratsumme, den Stichprobenumfang, den Anteil der Untersuchungseinheiten mit der in D erfassten Eigenschaft und den Anteil der Untersuchungseinheiten ohne die in D erfasste Eigenschaft bezeichnet.
Herleitung aus der Pearson-Korrelation
Der Einfachheit halber wird angenommen, dass das dichotome Merkmal die Werte 0 und 1 annimmt, sodass der Mittelwert in gleich ist. Nach der allgemeinen Formel berechnet sich die Korrelation zwischen und über
- .
Man kann nun eine Fallunterscheidung treffen: Untersuchungseinheiten sind D=1 und liegen mit über dem Mittelwert in D, die übrigen Untersuchungseinheiten sind D=0 und liegen mit unter dem Mittelwert in D. Damit gilt
- ,
was sich über
zur obigen Gleichung vereinfachen lässt.
Anwendung in gängiger Statistiksoftware
SPSS und R verwenden automatisch die punktbiseriale Rechenweise, wenn die Befehle CORRELATE
bzw. cor
, cor.test
angefordert werden und eine der Variablen nur zwei Ausprägungen (z. B. die Werte 0 und 1) hat, die auch als berechnungsrelevant angesehen werden (−7 oder 99 z. B. können in SPSS als fehlende Werte markiert und somit ignoriert werden).
Literatur
- Jürgen Bortz: Statistik für Human- und Sozialwissenschaftler. 6. Auflage. Springer, Berlin u. a. 2005, ISBN 3-540-21271-X.
- J. Cohen, P. Cohen, S. G. West, L. S. Aiken: Applied Multiple Regression / Correlation Analysis For The Behavioral Sciences. London 2003, ISBN 0-8058-2223-2.