Was sind "gedrehte" und "nicht gedrehte" Hauptkomponenten, da PCA immer die Koordinatenachsen dreht?


13

Soweit ich weiß, werden Hauptkomponenten durch Drehen der Koordinatenachsen erhalten, um sie an den Richtungen der maximalen Varianz auszurichten.

Trotzdem lese ich immer wieder über "nicht gedrehte Hauptkomponenten" und meine Statistiksoftware (SAS) gibt mir sowohl varimax-gedrehte als auch nicht gedrehte Hauptkomponenten. Hier bin ich verwirrt: Wenn wir Hauptkomponenten berechnen, sind die Achsen bereits gedreht; Warum ist dann eine weitere Drehung erforderlich? Und was bedeutet "nicht gedrehte Hauptkomponente"?


1
Fragen, die ausschließlich die Funktionsweise von Software betreffen, werden hier nicht behandelt, aber Sie haben möglicherweise eine echte statistische Frage. Möglicherweise möchten Sie Ihre Frage bearbeiten, um das zugrunde liegende statistische Problem zu klären. Wenn Sie die statistischen Konzepte verstehen, werden Sie feststellen, dass die softwarespezifischen Elemente offensichtlich sind oder zumindest leicht aus der Dokumentation zu entnehmen sind.
gung - Reinstate Monica

1
@gung - Meine Frage bezieht sich nicht auf Software. Vielleicht habe ich es falsch platziert. Alles, was ich wissen wollte, ist, dass wir nach meinem Verständnis Hauptkomponenten nur erhalten, wenn wir die Achsen in der Linie der maximalen Varianz drehen. Was ist dann die nicht gedrehte Hauptkomponente, ein Begriff, den ich auf verschiedenen Seiten über PCA gefunden habe. Bitte lassen Sie mich wissen, wenn meine Frage noch nicht eindeutig ist.
Srewashi Lahiri

Es sicherlich sieht aus wie es über SAS ist. Wenn dies nicht der Fall ist, würde ich Ihr Q bearbeiten, um die Verweise auf SAS zu entfernen und Ihre Frage in softwareneutralen Begriffen erneut zu erläutern. Sie könnten auch daran interessiert sein, diesen Thread zu lesen .
gung - Wiedereinsetzung von Monica

Ich erwähnte SAS, weil ich die Analyse in dieser Software durchführte. Selbst wenn Sie das Wort weglassen, können Sie mir nur eine Erklärung zu meiner bearbeiteten Version der Frage geben. Auch ich bin durch den Thread gegangen. Bitte korrigieren Sie mich, wenn ich falsch liege. Wenn wir Hauptkomponenten berechnen, bedeutet dies, dass die Achsen bereits gedreht sind. Eine weitere Varimax-Notation ist also nicht erforderlich. Ist das so? Ich bin wirklich verwirrt über diesen Teil. Vielen Dank im Voraus
Srewashi Lahiri

2
Srewashi, ich habe mir die Freiheit genommen, Ihre Frage basierend auf Ihren Erläuterungen in den Kommentaren grundlegend umzuschreiben. Ich denke, es ist eine gute Frage, +1. Bitte überprüfen Sie, ob meine Änderungen Ihre Absichten widerspiegeln! Sie können immer mehr bearbeiten. Cc to @gung.
Amöbe sagt Reinstate Monica

Antworten:


15

Dies wird eine nicht technische Antwort sein.

Sie haben Recht: PCA ist im Wesentlichen eine Drehung der Koordinatenachsen, die so gewählt wird, dass jede erfolgreiche Achse so viel Varianz wie möglich erfasst.

In einigen Disziplinen (wie z. B. Psychologie) wenden die Menschen PCA gerne an, um die resultierenden Achsen zu interpretieren. Das heißt, sie möchten sagen können, dass die Hauptachse # 1 (die eine bestimmte lineare Kombination der ursprünglichen Variablen ist) eine bestimmte Bedeutung hat. Um diese Bedeutung zu erraten, würden sie die Gewichte in der linearen Kombination betrachten. Diese Gewichte sind jedoch oft unübersichtlich und es kann keine klare Bedeutung festgestellt werden.

In diesen Fällen wird manchmal ein wenig an der Vanille-PCA-Lösung herumgebastelt. Sie nehmen bestimmte Anzahl von Hauptachsen (die „signifikant“ durch ein Kriterium angesehen werden), und zusätzlich drehen sie, versuchen , einig „einfache Struktur“ zu erreichen --- die Linearkombinationen, die einfacher wären , zu interpretieren. Es gibt spezielle Algorithmen, die nach einer möglichst einfachen Struktur suchen. einer von ihnen heißt varimax. Nach der Varimax-Rotation erfassen aufeinanderfolgende Komponenten nicht mehr so ​​viel Varianz wie möglich! Diese Funktion von PCA wird durch die zusätzliche Varimax-Drehung (oder eine andere Drehung) beeinträchtigt.

Bevor Sie also die Varimax-Rotation anwenden, haben Sie "nicht gedrehte" Hauptkomponenten. Und danach erhalten Sie "gedrehte" Hauptkomponenten. Mit anderen Worten bezieht sich diese Terminologie auf die Nachbearbeitung der PCA-Ergebnisse und nicht auf die PCA-Rotation selbst.


All dies ist etwas kompliziert durch die Tatsache, dass das, was gedreht wird, Belastungen und nicht Hauptachsen als solche sind. In Bezug auf die mathematischen Details verweise ich Sie (und jeden interessierten Leser) auf meine lange Antwort hier: Wird nach der PCA noch eine Rotation (wie Varimax) nach der PCA durchgeführt?


Ich habe noch keine bessere und klarere Erklärung gefunden. Ich habe auch den anderen von Ihnen bereitgestellten Link durchgegangen, muss ihn jedoch noch vollständig entschlüsseln. Wenn ich richtig verstanden habe, sind nicht gedrehte Hauptkomponenten bereits orthogonal und nicht korreliert. Hier habe ich ein wenig Verwirrung - da PCs aufeinanderfolgenden maximalen Abweichungen entsprechen, ist es notwendig, dass, nachdem der erste PC gefunden wurde, die zweite maximale Abweichungslinie (zweiter PC) bei 90 Grad (orthogonal) zu der ersten liegt und so weiter ?
Srewashi Lahiri

Das ist richtig: "nicht gedrehte" Hauptkomponenten sind nicht korreliert und "nicht gedrehte" Hauptachsen sind orthogonal. Und ja, es ist notwendig, dass aufeinanderfolgende Hauptachsen orthogonal und Hauptkomponenten unkorreliert zu den vorherigen sind (man kann es mathematisch beweisen). Übrigens, wenn Sie der Meinung sind, dass diese (oder eine andere) Antwort das Problem für Sie behebt, können Sie sie "akzeptieren", indem Sie auf das grüne Häkchen links klicken. Sobald Sie 15 Reputation erreicht haben, können Sie auch Antworten, die Sie nützlich finden, upvoten (ich denke, dass Sie derzeit keine Antworten upvoten können).
Amöbe sagt Reinstate Monica

+1. what gets rotated are loadings and not principal axes as suchIch würde hinzufügen, dass dies ein technischer Begriff ist. Theoretisch sind diese beiden Rotationsarten nebeneinander. In PCA rotieren wir, um die spezifische orthogonale Basis zu finden (die mit der steilsten Geröllkurve von Eigenwerten). In varimax rotieren wir, um eine andere spezifische orthogonale Basis zu finden (mit der Interpetable-Most-Struktur). Wir könnten jede Art von orthogonaler Basis machen.
ttnphns

Können Sie es, wenn möglich, dem Laien erklären, was nicht gedrehte PCs bedeuten?
sai_636

@ sai_636 Laienbegriffe finden Sie unter stats.stackexchange.com/questions/2691 .
Amöbe sagt Reinstate Monica
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.