Was genau heißt in PCA „Hauptkomponente“?


18

Angenommen, ist der Vektor, der die Varianz der Projektion der Daten mit der Entwurfsmatrix maximiert .XuX

Nun habe ich Materialien gesehen, die als (ersten) Hauptbestandteil der Daten bezeichnen, der auch der Eigenvektor mit dem größten Eigenwert ist.u

Ich habe jedoch auch gesehen, dass die Hauptkomponente der Daten .Xu

Offensichtlich sind und verschiedene Dinge. Kann mir hier jemand helfen und mir sagen, was der Unterschied zwischen diesen beiden Definitionen der Hauptkomponenten ist?X uuXu


Eigenvektor u ist die Richtung der Achse (Werte von u sind die Richtungskosinusse relativ zu den Originalachsen). Xu sind die Daten selbst, die Werte der Hauptkomponente, die Koordinaten auf der oben genannten Achse.
TTNPHNS

Antworten:


25

Sie haben absolut Recht, wenn Sie feststellen, dass (einer der Eigenvektoren der Kovarianzmatrix, z. B. der erste) und X u (Projektion der Daten auf den von u aufgespannten eindimensionalen Unterraum ) zwei verschiedene Dinge sind Sie werden oft als "Hauptbestandteil" bezeichnet, manchmal sogar im selben Text.uXuu

In den meisten Fällen ergibt sich aus dem Zusammenhang, was genau gemeint ist. In einigen seltenen Fällen kann es jedoch durchaus verwirrend sein, z. B. wenn verwandte Techniken (wie spärliche PCA oder CCA) erörtert werden, bei denen verschiedene Richtungen nicht orthogonal sein müssen. In diesem Fall hat eine Aussage wie "Komponenten sind orthogonal" sehr unterschiedliche Bedeutungen, je nachdem, ob es sich um Achsen oder Projektionen handelt.uich

Ich würde befürworten Aufruf a „Hauptachse“ oder eine „Hauptrichtung“, und X u a „Hauptbestandteil“.uXu

Ich habe als "Hauptkomponentenvektor" bezeichnet gesehen.u

Ich sollte erwähnen, dass die alternative Konvention darin besteht, "Hauptkomponente" und X u "Hauptkomponentenbewertungen" zu nennen.uXu

Zusammenfassung der beiden Konventionen:

Übereinkommen 1Konvention 2u{HauptachseHauptrichtungHauptkomponentenvektorHauptbestandteilXuHauptbestandteilHauptkomponente Scores

Hinweis: Nur Eigenvektoren der Kovarianzmatrix, die Nicht-Null-Eigenwerten entsprechen, können als Hauptrichtungen / -komponenten bezeichnet werden. Wenn die Kovarianzmatrix einen niedrigen Rang hat, hat sie einen oder mehrere Null-Eigenwerte. entsprechende Eigenvektoren (und entsprechende Projektionen, die konstant Null sind) sollten nicht als Hauptrichtungen / -komponenten bezeichnet werden. Siehe eine Diskussion in meiner Antwort hier.


1
Konvention 2 sollte verboten werden. Es hat die Fähigkeit, für Anfänger kein Ende der Verwirrung zu schaffen, da es Basisvektoren und Komponenten von Datenvektoren in Bezug auf die Basis zusammenführt.
Vermutungen

Was ist mit der Loadings-Definition? Sind Ladungen die Einzelwerte des Eigenvektors u?
Makis


@amoeba danke! eine letzte Frage. Wenn in SVD für X = USVh (Vh: V transponiert) die Eigenvektoren die Spalten von U sind, kann ich dann Vh als Ladungen aufrufen?
Makis

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.