Hintergrund: Ich habe Hunderte von Teilnehmern meiner Umfrage gefragt, wie sehr sie an ausgewählten Bereichen interessiert sind (nach fünf Punkten Likert-Skalen, wobei 1 "nicht interessiert" und 5 "interessiert" bedeutet).
Dann habe ich PCA ausprobiert. Das Bild unten ist eine Projektion in die ersten beiden Hauptkomponenten. Farben werden für Geschlechter verwendet und PCA-Pfeile sind Originalvariablen (dh Interessen).
Ich habe bemerkt, dass:
- Punkte (Befragte) sind durch die zweite Komponente recht gut getrennt.
- Keine Pfeilspitzen mehr.
- Einige Pfeile sind viel kürzer als andere.
- Variablen neigen dazu, Cluster zu bilden, aber keine Beobachtungen.
- Es scheint, dass nach unten zeigende Pfeile (zu Männern) hauptsächlich die Interessen von Männern sind und Pfeile, die nach oben zeigen, hauptsächlich die Interessen von Frauen sind.
- Einige Pfeile zeigen weder nach unten noch nach oben.
Fragen: Wie kann man die Beziehungen zwischen Punkten (Befragten), Farben (Geschlecht) und Pfeilen (Variablen) richtig interpretieren? Welche anderen Schlussfolgerungen über die Befragten und ihre Interessen können aus dieser Verschwörung gezogen werden?
Die Daten finden Sie hier .