Viele Statistiklehrbücher bieten eine intuitive Illustration der Eigenvektoren einer Kovarianzmatrix:
Die Vektoren u und z bilden die Eigenvektoren (also Eigenachsen). Das macht Sinn. Was mich jedoch verwirrt, ist, dass wir Eigenvektoren aus der Korrelationsmatrix extrahieren , nicht die Rohdaten. Darüber hinaus können sehr unterschiedliche Rohdatensätze identische Korrelationsmatrizen aufweisen. Zum Beispiel haben beide die folgenden Korrelationsmatrizen von:
Als solche haben sie Eigenvektoren, die in die gleiche Richtung zeigen:
Wenn Sie jedoch dieselbe visuelle Interpretation anwenden würden, in welche Richtungen sich die Eigenvektoren in den Rohdaten befinden, würden Sie Vektoren erhalten, die in verschiedene Richtungen zeigen.
Kann mir bitte jemand sagen, wo ich falsch gelaufen bin?
Zweite Änderung : Wenn ich so mutig sein darf, konnte ich mit den hervorragenden Antworten unten die Verwirrung verstehen und illustrieren.
Die visuelle Erklärung stimmt mit der Tatsache überein, dass die aus der Kovarianzmatrix extrahierten Eigenvektoren unterschiedlich sind.
Kovarianzen und Eigenvektoren (rot):
Kovarianzen und Eigenvektoren (blau):
Korrelationsmatrizen spiegeln die Kovarianzmatrizen der standardisierten Variablen wider. Die visuelle Überprüfung der standardisierten Variablen zeigt, warum in meinem Beispiel identische Eigenvektoren extrahiert werden:
[PCA]
Tag behalten . Wenn Sie die Frage neu fokussieren oder eine neue (verwandte) Frage stellen und einen Link zu dieser Frage erstellen möchten, scheint dies in Ordnung zu sein, aber ich denke, diese Frage ist PCA-ish genug, um das Tag zu verdienen.