Diskussion:Faktorenanalyse
Bahnhof
Sorry, aber ich finde diese Seite zu umständlich/unübersichtlich/kompliziert. Wenn ich mir einen knappen Überblick verschaffen will, was die Faktorenanalyse ausmacht, dann funktioniert das nicht mit dieser Seite.
Habe den Kommentar von 80.171.192.76 vom 28.09.09 mal hierhin verschoben, da er in die gleiche Kritik hat --Sigbert 21:39, 29. Sep. 2009 (CEST)
Ganz ehrlich, aber wieso erklären die Wikipedia Seiten Analyse-Verfahren immer auf höchst unverständlichem Niveau? Meine Erklärung:
Mit der Faktorenanalyse wird untersucht, ob sich unter den betrachteten Variablen Gruppen von Variablen befinden, denen jeweils eine Hintergrundvariable (Faktor) zugrunde liegt. Es wird somit der Wirkzusammenhang zwischen zwei oder mehreren Variablen untersucht.
Schritte der Faktorenanalyse lt. Backhaus et al.:
- Variablenauswahl und Berechnung der Korrelationsmatrix
- Extraktion der Faktoren
- Bestimmung der Kommunalitäten
- Zahl der Faktoren
- Faktorinterpretation
- Bestimmung der Faktorwerte
Im ersten Schritt werden die relevanten Variablen ausgewählt und die Korrelationen anhand der Korrelationsmatrix untersucht. Die Korrelationsmatrix bildet den Ausgangspunkt für weitere Berechnungen. Hohe Korrelationen einzelner Variablen weisen dabei auf einen gemeinsamen Faktor hin. Daraufhin werden die einzelnen Faktoren identifiziert. Die Faktorladungen der Variablen geben erklären die Korrelation mit dem jeweiligen Faktor. Im nächsten Schritt wird der Teil der Gesamtvarianz einer Variable bestimmt, der durch die gemeinsamen Faktoren erklärt werden soll. Dieser wird durch die Kommunalitäten ausgedrückt. Im vierten Schritt wird die Anzahl der zu extrahierenden Faktoren festgelegt, die sich als geeignet herausstellt. Wurden die Faktoren ermittelt und interpretiert, kann man in einem letzten Schritt den einzelnen Fällen Werte für diese Faktoren, die sogenannten Faktorwerte, zuordnen.
- Gut, mal den Versuch einer Erwiderung:
- Das Ergebnis einer Faktoranalyse (FA) kann, muss aber nicht, eine Hintergrundvariable sein. Erst die erfolgreiche (theorie-konforme) Interpretation macht aus einem Faktor eine Hintergrundvariable.
- Was genau ist ein Wirkzusammenhang?
- Die Basis der FA ist die Kovarianzmatrix und eben nicht nur die Korrelationsmatrix als spezielle Kovarianzmatrix.
- Die Faktorladungen erklären nur die Korrelation zwischen Variablen und Faktoren, wenn man keine Rotation oder nur orthogonale Rotationen benutzt. Ich bin mir nicht mal sicher, ob dies auch für alle Extraktionsverfahren (z.B. in SPSS) gilt.
- Was sind denn Faktorladungen? Der Begriff wird benutzt, aber nicht erklärt.
- Was sind denn geeignete Faktoren?
- Backhaus et al. sind, aus meiner Sicht, keine gute Referenz, weil sie Dinge ungenau oder gar nicht darstellen. Das ist vermutlich der Preis für eine einfache und praxisnahe Darstellung.
- Die Einleitung zur FA sollte allerdings wirklich verbessert werden und erst der hintere Teil sollte sich der exakteren Darstellung widmen. --Sigbert 22:09, 29. Sep. 2009 (CEST)
- Ich kann mich der Aussage "Bahnhof" nur anschließen. Habe in meinem Leben schon diverse Faktorenanalysen durchgeführt - aber in dem angegebenen Mülltrennungsbeispiel fand ich wenig, was mit meiner Vorstellung von FA zu tun hat, zumal die Mülltrennungsanlage gebaut wurde, NACHDEM die Faktoren schon offenbar bekannt waren und keine experimentelle Anlage darstellt, um herauszufinden, dass Materialien tatsächlich auf Wind oder Magnetismus oder beides reagieren. Es gibt so viele Beispiele für Faktorenanalysen, bei denen man nicht VORHER schon die Faktoren kennt, würde jemand eines ersinnen bitte? Typischerweise erhebt man doch anhand von n Aspekten beschriebene Dinge und versucht via FA dann aus diesen eine sparsamene Beschreibung anhand von m Aspekte zu finden, mit m Faktoren, deren Anzahl kleiner als n ist. Psychologische Fragebögen finde ich hier immer ein recht gutes Beispiel. Bestimmt kann man aber auch Müll nach n Aspekten untersuchen und dann auf m Faktoren kommen... -- 77.186.154.48 18:35, 30. Aug. 2011 (CEST)
Nun habe ich mich selbst einmal mit dem Thema herumprügeln dürfen und bin dabei auf interessante, sehr einfache Erklärungen gestoßen. Vielleicht sollte man diese Weblinks des Pflegewikis anfügen:
__zur Faktorenanalyse:
http://www.pflegewiki.de/wiki/Faktorenanalyse#Begriffe
__zur Korrelation http://www.pflegewiki.de/wiki/Korrelation http://www.pflegewiki.de/wiki/Korrelationskoeffizient http://www.pflegewiki.de/wiki/Ma%C3%9Fkorrelationskoeffizient_nach_Pearson
Oder kurz:
- Variable = Attribut des Ausgangsdatensatzes
- Faktor = latente Variable; muss nach einer Hypothese aufgestellt werden, da sonst inhaltslos
- Faktorladung_ij = (Korrelation)² zwischen Faktor_i und Variable_j; zur Bezifferung der Korrelation gibt es verschiedene Ansätze, ein häufig verwendeter ist der Maßkorrelationskoeffizient nach Pearson mit reellen Werten zwischen -1 und 1; durch das ()² verschwindet das Vorzeichen und verhindert so, dass sich aussagekräftige Korrelationen bei der Berechnung des Eigenwertes gegenseitig auslöschen.
- Eigenwert_i = Summe aller Faktorladungen_i d.h. geklärte Varianz über alle Variablen (Eigenwert=1 entspricht dem Aufklärungswert einer Variable); der Quotient Eigenwert_i/Anz.Variablen gleicht der prozentualen Aufklärung der Gesamtvarianz durch den Faktor_i
schon etwas besser? Gruß--Moedn (Diskussion) 13:29, 21. Jan. 2016 (CET)
Huhn-Ei-Problem
Faktor: Dimension eines Faktorraumes
Faktorraum: Raum der durch die Faktoren aufgespannt wird
Es steht zwar nicht Definition drüber, so dass formale Ungenauigkeiten toleriert werden könnten. Dennoch finde ich die Erklärung eines Faktors mit Hilfe des Faktorraumes und umgekehrt für problematisch
--Rainer198 17:48, 3. Jan 2006 (CET)
Ungenau
Ich bin zwar kein Experte, aber ein paar Aussagen hier scheinen mir mathematisch unpräzise:
- In der Regel sind die extrahierten Faktoren voneinander unabhängig, d. h. ihre Korrelation beträgt 0 bzw. sie sind orthogonal.
Wenn man es genau liest ist nichts daran falsch, aber da entsteht doch leicht der Eindruck orthogonal = unabhängig, was definitiv falsch wäre. Und die extrahierten Faktoren sind immer orthogonal, es entsteht aber der Eindruck dass dies nur "in der Regel" so sei.
- (Beschreibung am Beispiel der PCA)
Ich glaube so wie das beschrieben ist macht PCA nicht viel Sinn, weil man einen 2D-Vektor (Pfeil auf der Karte) ja mit zwei Komponenten bereits exakt darstellen kann. Die Daten spannen irgendwie gar keinen vierdimensionalen Raum auf? Und zu PCA gibt es bereits einen eigenen Artikel, den habe ich mal verlinkt. Matumio 12:11, 24. Mär 2006 (CET)
Eigenwert
Hat der Eigenwert hier etwas mit dem mathematischen Eigenwertproblem zu tun? --Chrisqwq 12:06, 26. Sep 2006 (CEST)
- Siehe Eigenwertproblem#Praktische_Beispiele. --Matumio 22:11, 26. Sep 2006 (CEST)
- Ich würde sagen, nein. Der Eigenwert in der Hauptkomponentenanyse ist nur ein Kriterium dafür, ob man einen Faktor interpretieren soll oder nicht. Es gibt da kein mathematisches Problem oder gar einen Vektor. 217﹒125﹒121﹒169 23:56, 26. Sep 2006 (CEST)
- Matimuio hat recht, es ist eine Anwendung --Chrisqwq 09:54, 27. Sep 2006 (CEST)
Skalenniveau
Unter den Voraussetzungen steht: Alle Variablen müssen mindestens intervallskaliert sein Aber das Beispiel direkt im Anschluss unter "Historisches zur Faktorenanalyse" enthält Fragen/Variablen die nur ordinalskaliert sind. Kann mir das jemand erklären? --Gerhard 21:41, 18. Okt. 2006 (CEST)
- Diese Erklärung lässt sich recht einfach geben: Das mathematische Modell hinter der Faktorenanalyse fordert, dass die Variablen intervallskaliert sein mögen, da Korrelationen etc. berechnet werden. ABER die Faktorenanalyse ist ziemlich robust gegen Verletzungen dieser Voraussetzung, und in vielen Anwendungskontexten (den meisten, die mir bekannt sind), ist das, was da zu messen ist, kaum intervallskaliert, aber recht gut ordinal zu messen. Die Faktorenanalyse ist ein guter Zwischenschritt, um aus "ganz und gar ordinalskalierten" Ausgangsvariablen "schon ziemlich intervallskaliert" Endvariablen zu basteln. In den Fällen, wo schon die Ausgangsvariablen intervallskaliert sind, ist häufig eine FA nicht mehr besonders interessant, indem sie zu wenig neuen Erkenntnissen verhilft. -- 77.186.154.48 18:46, 30. Aug. 2011 (CEST)
Überarbeiten (ei? tämm?)
Der unsinnige Denglish-Begriff "Item" ist undefiniert. Damit ist der Artikel schlichtweg unverständlich. --Leider 13:27, 5. Jun. 2007 (CEST)
- Der Begriff ist nicht "unsinnig" oder "undefiniert", sondern auch in der deutschsprachigen empirischen (Sozial-)Wissenschaft seit Jahrzehnten eine absolut gebräuchliche und selbstverständliche (sic!) Bezeichnung für Erhebungseinheiten. (nicht signierter Beitrag von 134.99.100.19 (Diskussion) 17:01, 18. Jun. 2007)
- Da muss ich zustimmen. Der Begriff Item ist absolut gebräuchlich und benötigt meiner Meinung nach an dieser Stelle keiner weiteren Erläuterung.
- Gibt's vielleicht einen eigenen Wiki-Artikel über Fragebögen und Testtheorie? Dann könnte von hier aus der fragliche Begriff verlinkt werden. Und unter Item verstehe ich einen als Frage oder Aussage formulierten Erhebungsaspekt (z. B. "Ich mag Psychotests.") zuzüglich der zur Verfügung gestellten Antwortskala (z. B. "ja", "nein", "weiß nicht"). Die Antworten werden in einer Variable abgebildet, welche das Ausgangsmaterial für die FA darstellen. Ein gutes deutsches Wort gibt es dafür nicht. -- 77.186.154.48 18:46, 30. Aug. 2011 (CEST)
- Ein Item ist keine "Erhebungseinheit". Erhebungseinheiten sind die einzelnen Elemente einer Grundgesamtheit (Population). Sigma^2 (Diskussion) 18:37, 4. Feb. 2015 (CET)
Inhalte aus einem anderen Wiki
In einem bei Wikia gehosteten Marktforschungs-Wiki gibt es eine recht übersichtliche Darstellung zur Faktorenanalyse: http://marktforschung.wikia.com/wiki/Faktorenanalyse Ist es sinnvoll diese hier zu verlinken oder fliegt das als Linkspam gleich wieder raus? Sind meiner Ansicht nach relevante weiterführende Informationen, ich war da aber auch schon bei anderen Artikeln ganz anderer Meinung als alteingesessene Wikipedianer. Da ich an der Seite selbst mitarbeite stelle ich den Link lieber mal zur Diskussion anstatt ihn einfach einzubauen.
Ich finde die Seite wesentlich besser. Sie ist meiner Meinung nach sehr viel ausführlicher aber komischerweise trotzdem leichter zu verstehen. Danke für den Link ! MfG
Meine Änderungen
Upps - da bin ich wohl in eine Falle gelaufen. Ich habe nicht beobachtet, daß der andere Artikel "Hauptkomponentenanalyse" existiert, und Ergänzungen eingebracht, die dort im Prinzip schon stehen. Es war mir nicht deutlich, daß hier der Fokus eher auf *dem Unterschied* bzw dem anderen Zugang zur Methode liegt. An die "Gemeinde": falls meine Änderungen als überflüssig oder nicht hierhergehörend anzusehen sind, habe ich nichts dagegen, sie zu reverten. Ansonsten wäre der spezifische Zugang der FA gegenüber der PCA zu deutlicher zu fokussieren.
Sorry Gottfried Helms, Kassel --84.138.86.128 12:04, 10. Feb. 2008 (CET)
Herleitung zum Hauptsatz
Ich finde eine Herleitung zum Hauptsatz der Faktorenanalyse würde nicht schaden. Ich hätte da folgenden Vorschlag:
mit und
Da z normiert (und somit ) ist ergibt sich:
Da konstant ist:
Da die Forderung besteht das z und unkorelliert sind ergibt sich:
Da den Mittelwert 0 hat ergibt sich:
und somit
q.e.d.
Schaut am besten mal einer drüber ob ich das alles richtig gemacht habe.
' entspricht bei mir dem transponieren.
Ansosnten komme ich auf und nicht wie im Artikel, ich weiß aber gerade nicht
ob das von großer Bedeutung ist.
- Sieht vom ersten drüberfliegen her gut aus. Durch die vielen Sonderzeichen wird das ganze jedoch recht schnell unübersichtlich für den nicht ganz so "geneigten Leser".--141.113.86.94 12:57, 23. Sep. 2009 (CEST)
- Der Hauptsatz ist aber Fehler beim Parsen (Konvertierungsfehler. Der Server („https://wikimedia.org/api/rest_“) hat berichtet: „Cannot get mml. Server problem.“): {\displaystyle \operatorname {Cov} (x_{i},x_{j})=(\Gamma \Gamma ^{\operatorname {T} })_{ij}+\operatorname {Cov} (\epsilon _{i},\epsilon _{j})} , da könnte den Leser ein Ansatz mit mit einem multivariaten verwirren. --Sigbert 14:56, 24. Sep. 2009 (CEST)
Eigenfaces
Die Eigenfaces werden eben gerade nicht faktorenanalytisch sondern durch PCA erzeugt, siehe:
Turk, M. & Pentland, A. Face Recognition Using Eigenfaces Proc. IEEE Conference on Computer Vision and Pattern Recognition, 1991
- Meine Rede. Habe das jetzt rausgekippt.
- Was ist mit den auch hier aufgeführten ICA-Beispielen? mE ist eine ICA genausowenig wie eine PCA mit der Faktoranalyse gleichzusetzen... --84.227.24.77 20:15, 10. Aug. 2008 (CEST)
Inferenzstatistik?
Faktorenanalyse dient ja hauptsächlich der Datenreduktion, wie Mittelwert etc. Ist es daher nicht oft auch deskriptiv? Gibt es eine Quelle oder gute Begründung, warum die typische Faktorenanalyse Inferenz darstellt?
Danke! -- alinapsy
- Faktoranalyse ist explorativ. Die Grundannahmen, die im Artikel dargestellt werden, sind Voraussetzungen, die gebraucht werden, damit das Verfahren überhaupt funktioniert. Um Inferenzstatistik zu betreiben, brauchst du weitere Annahmen, z.B. Verteilungsannahmen an die Items/manifesten Variablen und/oder Modellannahmen, welche Items einen Faktor bilden. Dies führt dann in den Bereich der konfirmativen Faktoranalyse. --Sigbert 12:06, 21. Aug. 2009 (CEST)
Psychologie
Diese Seite wird von der Psychologie ( http://de.wikipedia.org/wiki/Thurstone ) verlinkt, aber nur die mathematische Bedeutung erklärt.
- Naja, sie wird in vielen Wissenschaften verwendet. So nach dem Artikel würde ich mal sagen: Er konnte So zeigen, das Intelligenz nicht auf 2 Faktoren zurückzuführen ist, sondern auf 7. Was ist dir denn unklar? --source 15:58, 23. Jan. 2009 (CET)
- Man könnte auch sagen: Es wird nur ihre mathematische Bedeutung erklärt, weil sie nur eine mathematische Bedeutung hat. -- Arno Matthias 17:15, 23. Jan. 2009 (CET)
Geometrische Bedeutung
Der Satz Die Koordinaten dieser Punkte stellen die sogenannten Faktorladungen dar. ist falsch. Die Koordinaten sind eine (n: Anzahl der Beobachtungen, q: Dimension des Faktorraums) Matrix, die Ladungen jedoch sind jedoch eine Matrix (p: Anzahl der Items). --Sigbert 11:58, 21. Aug. 2009 (CEST)
- Und zudem ist der Begriff "Ladung" bzw. "Ladungsmatrix" nirgends verstehbar erklärt, leider, was dazu geführt hat, dass ich, obwohl mathematisch und psychologisch etwas vorgebildet, komplett aufgegeben habe, ihn zu verstehen. Kann jemand solche Begriffe bitte entweder verlinken oder erklären? --2A00:FE00:4103:1:0:0:0:200 19:11, 16. Okt. 2014 (CEST)
- Habe mal bei Ladungsmatrix ein Fehler beim Parsen (Konvertierungsfehler. Der Server („https://wikimedia.org/api/rest_“) hat berichtet: „Cannot get mml. Server problem.“): {\displaystyle Gamma} hinzugefügt. --15:21, 18. Okt. 2014 (CEST)
Faktoren- versus Hauptkomponentenanalyse
Auch wenn diese Aussage aus einem Lehrbuch zu stammen scheint: "Man modelliert nur die Varianzen, nicht aber die Kovarianzen der x." denke ich sie ist falsch. Denn betrachte ich die erste Hauptkomponente, dann zeigt sie in die Richtung der grössten Varianz. Diese Richtung hat die Eigenschaft, dass die darauf "projizierten" Datenpunkte den kleinsten Abstand zu ihr haben und da fliesst die Kovarianz implizit mit ein. --Sigbert (Diskussion) 11:53, 27. Apr. 2017 (CEST)