PCA ist in erster Linie eine Datenreduktionstechnik, bei der das Ziel darin besteht, eine Projektion von Daten auf einen Raum mit niedrigeren Dimensionen zu erhalten. Zwei äquivalente Ziele bestehen darin, entweder die Varianz iterativ zu maximieren oder den Rekonstruktionsfehler zu minimieren. Dies wird in einigen Details in den Antworten auf diese vorherige Frage herausgearbeitet .
Im Gegensatz dazu ist in erster Linie ein Faktoranalyse generatives Modell eines - dimensionalen Datenvektor X von selbst , dass
X = A S + ε
wo S das ist q dimensionale Vektor von latenten Faktoren, A ist p × k mit k < p , und ε ist ein Vektor der unkorrelierten Fehler. Die A- Matrix ist die Matrix der Faktorladungen . Dies ergibt eine spezielle Parametrisierung der Kovarianzmatrix als
Σ = A A T + DpX
X=AS+ϵ
SqAp×kk<pϵAΣ=AAT+D
Das Problem bei diesem Modell ist, dass es überparametrisiert ist. Dasselbe Modell wird erhalten, wenn
für eine beliebige
k × k- Orthogonalmatrix
R durch
A R ersetzt wird , was bedeutet, dass die Faktoren selbst nicht eindeutig sind. Es gibt verschiedene Vorschläge zur Lösung dieses Problems, aber es gibt
keine einzige Lösung, die Ihnen Faktoren für die Art der Interpretation vorgibt, nach der Sie fragen. Eine beliebte Wahl ist die
Varimax- Rotation. Das verwendete Kriterium bestimmt jedoch nur die Rotation. Der von
A aufgespannte Spaltenraum ändert sich nicht, und da dies Teil der Parametrisierung ist, wird er durch die Methode bestimmt, die zur Schätzung von
Σ verwendet wirdAARk×kRAΣ - Mit maximaler Wahrscheinlichkeit in einem Gaußschen Modell, sagen wir.
Um die Frage zu beantworten, werden die ausgewählten Faktoren nicht automatisch anhand eines Faktorenanalysemodells angegeben, sodass es keine einzelne Interpretation der ersten Faktoren gibt. Sie müssen die Methode zur Schätzung (des Spaltenraums von) A und die Methode zur Auswahl der Rotation angeben . Wenn D = σ 2 I (alle Fehler haben die gleiche Varianz), ist die MLE-Lösung für den Spaltenraum von A der Raum, der durch das führende q aufgespannt wirdkAD=σ2IAq Hauptkomponentenvektoren aufgespannt wird, die durch eine Singularwertzerlegung gefunden werden können. Es ist natürlich möglich, diese Hauptkomponentenvektoren nicht zu drehen und als Faktoren zu melden.
Bearbeiten: Um zu betonen, wie ich es sehe, ist das Faktoranalysemodell ein Modell der Kovarianzmatrix als eine Rang- Matrix plus eine Diagonalmatrix. Ziel des Modells ist es daher, die Kovarianz mit einer solchen Struktur auf der Kovarianzmatrix am besten zu erklären . Die Interpretation ist, dass eine solche Struktur auf der Kovarianzmatrix mit einem nicht beobachteten k- dimensionalen Faktor kompatibel ist. Leider können die Faktoren nicht eindeutig wiederhergestellt werden, und wie sie innerhalb des Satzes möglicher Faktoren ausgewählt werden können, bezieht sich in keiner Weise auf die Erklärung der Daten. Wie bei PCA kann man die Daten im Voraus standardisieren und so ein Modell anpassen, das versucht, die Korrelationsmatrix als Rang k plus eine Diagonalmatrix zu erklären . kkk