Punktbiseriale Korrelation

aus Wikipedia, der freien Enzyklopädie
Dies ist die aktuelle Version dieser Seite, zuletzt bearbeitet am 4. März 2021 um 17:39 Uhr durch imported>Udo.Brechtel(580416) (Direktlink statt BKS).
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

Als punktbiseriale Korrelation wird der Korrelationskoeffizient für den Zusammenhang zwischen einem intervallskalierten Merkmal und einem dichotomen (bernoulliverteilten) Merkmal bezeichnet. Es handelt sich nicht um eine eigenständige Maßzahl, sondern um einen Spezialfall des gewöhnlichen Korrelationskoeffizienten nach Pearson, der in diesem Fall berechnet werden kann als

,

wobei die Quadratsumme, den Stichprobenumfang, den Anteil der Untersuchungseinheiten mit der in D erfassten Eigenschaft und den Anteil der Untersuchungseinheiten ohne die in D erfasste Eigenschaft bezeichnet.

Herleitung aus der Pearson-Korrelation

Der Einfachheit halber wird angenommen, dass das dichotome Merkmal die Werte 0 und 1 annimmt, sodass der Mittelwert in gleich ist. Nach der allgemeinen Formel berechnet sich die Korrelation zwischen und über

.

Man kann nun eine Fallunterscheidung treffen: Untersuchungseinheiten sind D=1 und liegen mit über dem Mittelwert in D, die übrigen Untersuchungseinheiten sind D=0 und liegen mit unter dem Mittelwert in D. Damit gilt

,

was sich über

zur obigen Gleichung vereinfachen lässt.

Anwendung in gängiger Statistiksoftware

SPSS und R verwenden automatisch die punktbiseriale Rechenweise, wenn die Befehle CORRELATE bzw. cor, cor.test angefordert werden und eine der Variablen nur zwei Ausprägungen (z. B. die Werte 0 und 1) hat, die auch als berechnungsrelevant angesehen werden (−7 oder 99 z. B. können in SPSS als fehlende Werte markiert und somit ignoriert werden).

Literatur

  • Jürgen Bortz: Statistik für Human- und Sozialwissenschaftler. 6. Auflage. Springer, Berlin u. a. 2005, ISBN 3-540-21271-X.
  • J. Cohen, P. Cohen, S. G. West, L. S. Aiken: Applied Multiple Regression / Correlation Analysis For The Behavioral Sciences. London 2003, ISBN 0-8058-2223-2.