Wenn ich einen Datensatz mit Beobachtungen und Variablen (Dimensionen) habe und im Allgemeinen klein ist ( ) und von klein ( ) bis vielleicht viel größer ( ).
Ich erinnere mich, dass ich gelernt habe, dass viel größer sein sollte als um eine Hauptkomponentenanalyse (PCA) oder eine Faktoranalyse (FA) durchzuführen, aber es scheint, dass dies in meinen Daten möglicherweise nicht so ist. Beachten Sie, dass ich für meine Zwecke selten an Hauptkomponenten nach PC2 interessiert bin.
Fragen:
- Welche Faustregeln gelten für die minimale Stichprobengröße, wenn PCA verwendet werden kann und wenn dies nicht der Fall ist?
- Ist es jemals in Ordnung, die ersten paar PCs zu benutzen, auch wenn oder n < p ist ?
- Gibt es Referenzen dazu?
Ist es wichtig, ob Ihr Hauptziel darin besteht, PC1 und möglicherweise PC2 zu verwenden:
- einfach grafisch oder
- als synthetische Variable dann in der Regression verwendet?