Im Gegensatz zur Hauptkomponentenanalyse sind die Lösungen für Faktoranalysemodelle nicht unbedingt verschachtelt. Das heißt, die Belastungen (zum Beispiel) für den ersten Faktor sind nicht unbedingt identisch, wenn nur der erste Faktor extrahiert wird, im Vergleich zu den ersten beiden Faktoren.
Stellen Sie sich vor diesem Hintergrund einen Fall vor, in dem Sie eine Reihe von Manifestvariablen haben, die stark korreliert sind und (nach theoretischer Kenntnis ihres Inhalts) von einem einzigen Faktor bestimmt werden sollten. Stellen Sie sich vor, dass explorative Faktoranalysen (nach der von Ihnen bevorzugten Metrik: Parallelanalyse, Geröllplot, Eigenwerte> 1 usw.) stark darauf hindeuten, dass es Faktoren gibt: einen großen Primärfaktor und einen kleinen Sekundärfaktor. Sie sind daran interessiert, die Manifestvariablen und die Faktorlösung zu verwenden, um die Werte der Teilnehmer für den ersten Faktor zu schätzen (dh Faktorwerte zu erhalten). In diesem Szenario wäre es besser:
- Passen Sie ein Faktormodell an, um nur 1 zu extrahieren Faktor und Faktorwerte (usw.) zu erhalten, oder
- Passen Sie ein zu extrahierendes Faktormodell an beide Faktoren , Faktorwerte für die Faktoren zu erhalten, aber die Werte für den zweiten Faktor wegwerfen / ignorieren?
Für welche ist die bessere Praxis, warum? Gibt es Forschungsergebnisse zu diesem Thema?
Is is always better to extract more factors when they exist?
ist nicht sehr klar. Es ist immer besser, so viele zu extrahieren, wie es gibt. Unter- oder Überanpassung verzerren beide die "wahre" latente Struktur aufgrund der multivariaten und nicht verschachtelten Natur der von Ihnen erwähnten Analyse. Das Problem ist, dass wir nicht genau wissen, wie viele Faktoren in unseren Daten enthalten sind. Und ob diese Daten so viele haben wie die Bevölkerung.