Obwohl noch einige Informationen fehlen (Anzahl Einzelpersonen und Elemente pro Subskala), finden Sie hier einige allgemeine Hinweise zur Skalenreduzierung. Da Sie auf der Ebene des Fragebogens arbeiten, verstehe ich auch nicht, warum seine Länge so wichtig ist (schließlich geben Sie nur zusammenfassende Statistiken wie Gesamt- oder Durchschnittswerte an).
Ich gehe davon aus, dass (a) Sie eine Reihe von K Elementen haben, die ein moralisches Konstrukt messen, (b) Ihre "eindimensionale" Skala ein Faktor zweiter Ordnung ist, der in verschiedene Facetten unterteilt werden kann, (c) Sie möchten Reduzieren Sie Ihre Skala auf k <K Elemente, um die Gesamtskalenwerte der Probanden mit ausreichender Genauigkeit zusammenzufassen und gleichzeitig die inhaltliche Gültigkeit der Skala zu erhalten.
Informationen zur Gültigkeit von Inhalten / Konstrukten dieser validierten Skala: Die Anzahl der Elemente wurde mit Sicherheit so gewählt, dass sie das interessierende Konstrukt am besten widerspiegeln. Durch die Verkürzung des Fragebogens reduzieren Sie tatsächlich die Konstruktabdeckung. Es wäre gut zu überprüfen, ob die Faktorstruktur dieselbe bleibt, wenn nur die Hälfte der Elemente berücksichtigt wird (was sich schließlich auch auf die Art und Weise auswirken könnte, wie Sie sie auswählen). Dies kann unter Verwendung traditioneller FA-Techniken erfolgen. Sie sind dafür verantwortlich, die Skala in einem ähnlichen Geist wie die Autoren zu interpretieren.
Informationen zur Zuverlässigkeit der Bewertungen : Obwohl es sich um ein stichprobenabhängiges Maß handelt, nimmt die Zuverlässigkeit der Bewertungen ab, wenn die Anzahl der Elemente verringert wird (vgl. Spearman-Brown-Formel ). Eine andere Möglichkeit, dies zu sehen, besteht darin, dass der Standardmessfehler (SEM) zunimmt. Siehe jedoch Ein NCME-Lehrmodul zum Standardmessfehler von Leo M Harvill. Es ist unnötig zu erwähnen, dass dies für jeden Indikator gilt, der von der Anzahl der Elemente abhängt (z. B. Cronbachs Alpha, mit dem eine Form der Zuverlässigkeit geschätzt werden kann, nämlich die interne Konsistenz). Hoffentlich hat dies keine Auswirkungen auf Vergleiche zwischen Gruppen, die auf Rohwerten basieren.
Meine Empfehlungen (der einfachste Weg) wären also:
- Wählen Sie Ihre Elemente aus, um die Konstruktabdeckung zu maximieren. Überprüfen Sie die Dimensionalität mit FA und die Abdeckung mit univariaten Antwortverteilungen.
- Vergleichen Sie die durchschnittlichen Zwischenkorrelationen mit den zuvor gemeldeten.
- Berechnen Sie die interne Konsistenz für den gesamten Maßstab und Ihre Verbundwerkstoffe. Überprüfen Sie, ob sie mit den veröffentlichten Statistiken auf der ursprünglichen Skala übereinstimmen (Sie müssen nichts testen, dies sind stichprobenabhängige Maßnahmen).
- Testen Sie die linearen (oder polychromen oder Rang-) Korrelationen zwischen ursprünglichen und reduzierten (Unter-) Bewertungen, um sicherzustellen, dass sie vergleichbar sind (dh, dass die Positionen einzelner Personen auf dem latenten Merkmal nicht stark variieren, wie dies durch die Rohbewertungen objektiviert wird );
- Wenn Sie eine externe fachspezifische Variable haben (z. B. Geschlecht, Alter oder am besten ein Maß für die Moral), vergleichen Sie die Gültigkeit bekannter Gruppen zwischen den beiden Formen.
Der schwierige Weg wäre, sich auf die Item-Response-Theorie zu verlassen, um diejenigen Items auszuwählen, die das Maximum an Informationen über die Reduzierung latenter Merkmale enthalten - die Reduzierung der Skala ist tatsächlich eine der besten Anwendungen. Modelle für polytome Gegenstände wurden teilweise in diesem Thread, Validierung von Fragebögen, beschrieben .
Update nach dem 2. Update
- Vergessen Sie alle IRT-Modelle für polytome Gegenstände mit so wenigen Motiven.
- Die Faktoranalyse leidet auch unter einer so geringen Stichprobengröße. Sie erhalten unzuverlässige Schätzungen der Faktorladungen.
- 30 Elemente geteilt durch 2 = 15 Elemente (es ist leicht, eine Vorstellung von der Erhöhung des entsprechenden SEM für die Gesamtpunktzahl zu bekommen), aber es wird definitiv schlimmer, wenn Sie Subskalen berücksichtigen (dies war eigentlich meine 2. Frage - Nr. Elemente ggf. pro Subskala)