Wie ist dieser PCA-Biplot zu interpretieren, der aus einer Umfrage stammt, an welchen Bereichen Menschen interessiert sind?


10

Hintergrund: Ich habe Hunderte von Teilnehmern meiner Umfrage gefragt, wie sehr sie an ausgewählten Bereichen interessiert sind (nach fünf Punkten Likert-Skalen, wobei 1 "nicht interessiert" und 5 "interessiert" bedeutet).

Dann habe ich PCA ausprobiert. Das Bild unten ist eine Projektion in die ersten beiden Hauptkomponenten. Farben werden für Geschlechter verwendet und PCA-Pfeile sind Originalvariablen (dh Interessen).

Ich habe bemerkt, dass:

  • Punkte (Befragte) sind durch die zweite Komponente recht gut getrennt.
  • Keine Pfeilspitzen mehr.
  • Einige Pfeile sind viel kürzer als andere.
  • Variablen neigen dazu, Cluster zu bilden, aber keine Beobachtungen.
  • Es scheint, dass nach unten zeigende Pfeile (zu Männern) hauptsächlich die Interessen von Männern sind und Pfeile, die nach oben zeigen, hauptsächlich die Interessen von Frauen sind.
  • Einige Pfeile zeigen weder nach unten noch nach oben.

Fragen: Wie kann man die Beziehungen zwischen Punkten (Befragten), Farben (Geschlecht) und Pfeilen (Variablen) richtig interpretieren? Welche anderen Schlussfolgerungen über die Befragten und ihre Interessen können aus dieser Verschwörung gezogen werden?

Die Daten finden Sie hier .

PCA-Analyse


Was repräsentiert Ihrer Meinung nach der erste PC? Das allgemeine Interesse des Befragten?
Placidia

Dieses Bild ist der Biplot von PCA . Wir empfehlen Ihnen, den Begriff zu durchsuchen, um zu lesen, wie er zu interpretieren ist. Kurz gesagt, es sind sowohl die PC-Ergebnisse als auch die variablen Belastungen, die auf demselben Bild angezeigt werden (aus Gründen der Übersichtlichkeit). Siehe auch meine erklärenden Bilder . Auf Ihrem Bild ist klar, dass PC2 hauptsächlich eine geschlechtsspezifische Heterogenitätsdimension ist, die am stärksten durch zwei Variablen definiert wird: Pflege + eine andere, die ich nicht erkennen kann.
ttnphns

@MiroslavSabo: Ich mag Ihre Handlung, weil sie zeigt, dass Männer und Frauen nicht zwei getrennte Cluster bilden (in Bezug auf ihre Interessen), sondern tatsächlich ein Spektrum bilden. Ich nehme an, Sie haben eine Forschungsarbeit vorbereitet. wurde es veröffentlicht? wird es noch sein?
Amöbe sagt Reinstate Monica

1
@amoeba Die Daten aus dem Beitrag (zusammen mit anderen Elementen im Fragebogen) sind jetzt öffentlich .
Miroslav Sabo

1
@DarwinPC Die Daten aus dem Beitrag (zusammen mit anderen Elementen im Fragebogen) sind jetzt öffentlich .
Miroslav Sabo

Antworten:


7

Die Punkte sind die Befragten und die Farben sind die Geschlechter. Das weißt du? Die Hauptachsen Ihres Diagramms stellen die ersten und zweiten PC-Ergebnisse dar, und Einzelpersonen werden auf dieser Basis dargestellt. Jemand im unteren linken Quadranten erhielt bei beiden niedrige Punktzahlen. PC2 scheint "männliche" und "weibliche" Interessen zu kennzeichnen. Ich weiß nicht, was PC1 bedeutet, aber es stellt wahrscheinlich eine Gesamtinteressenbewertung dar - Menschen mit vielen Interessen erzielen eine hohe Punktzahl. Oder vielleicht repräsentiert es Menschen mit leidenschaftlichen Interessen (Punktzahl 5).

Die Vektoren sind ein projiziertes Koordinatensystem für die ursprünglichen Variablen. Wenn Sie also einen Punkt senkrecht auf den Lesevektor projizieren, sollten Sie die Lesewertung dieser Person erhalten. Die relative Position ist hier wichtig.

Nehmen Sie einen "männlichen" Vektor wie "Adrenalinsport". Stellen Sie sich nun vor, Sie projizieren einen rosa Fleck von oben im oberen rechten Quadranten darauf. Die Koordinate dieser Person für "Adrenalinsport" ist negativ.

Warum befinden sich die Pfeile in der rechten Hälfte des Diagramms? Je tiefer eine Person in der linken Seite des Diagramms ist, desto weniger ihrer Projektionen sind positiv. Dies legt nahe, dass PC1 ein Maß für das Gesamtinteresse ist.

Ich bin mir nicht sicher, was Sie hier noch lernen könnten. Vielleicht möchten Sie sich PC3 und PC4 ansehen, wenn PC1 und PC2 Ihnen nur sagen, dass einige Menschen mehr Interessen haben als andere und dass Männer sich von Frauen unterscheiden.

Ihre Darstellung scheint um die PC1-Achse nahezu symmetrisch und in Bezug auf das Geschlecht symmetrisch zu sein. So viele Männer haben weibliche Interessen wie Frauen männliche Interessen ... oder stimmt das? Ich schaue nur auf die Punkte. Es könnte interessant sein, Bereiche zu betrachten, in denen die Karte nicht symmetrisch ist: großer PC1, mäßig negativer PC2 - dieser Sektor hat viel Action. Warum?


Könnten Sie mir vielleicht Ihre Gedanken zu meinem Biplot geben? Es fällt mir schwer, es zu interpretieren. Vielen Dank. stats.stackexchange.com/questions/276421/…
Seanosapien
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.