Es würde mich interessieren, Vorschläge zu erhalten, wann beim Erstellen von Skalen " Faktor-Scores " über einer einfachen Summe von Scores verwendet werden sollten. Dh "verfeinert" gegenüber "nicht verfeinerten" Methoden zur Bewertung eines Faktors. Aus DiStefano et al. (2009; pdf ), Hervorhebung hinzugefügt:
Es gibt zwei Hauptklassen von Faktor-Score-Berechnungsmethoden: verfeinert und nicht verfeinert. Nicht verfeinerte Methoden sind relativ einfache, kumulative Verfahren, um Informationen über die Platzierung von Personen in Bezug auf die Faktorverteilung bereitzustellen. Die Einfachheit bietet sich für einige attraktive Merkmale an, dh nicht verfeinerte Methoden sind sowohl leicht zu berechnen als auch leicht zu interpretieren. Durch verfeinerte Berechnungsmethoden werden Faktorwerte unter Verwendung ausgefeilterer und technischer Ansätze erstellt. Sie sind genauer und komplexer als nicht verfeinerte Methoden und liefern Schätzungen, bei denen es sich um standardisierte Scores handelt.
Wenn das Ziel meines Erachtens die Erstellung einer Skala ist, die für alle Studien und Einstellungen verwendet werden kann, ist eine einfache Summe oder Durchschnittsbewertung aller Skalenelemente sinnvoll. Nehmen wir jedoch an, dass das Ziel darin besteht, die Behandlungseffekte eines Programms zu bewerten, und dass der wichtige Kontrast innerhalb der Stichprobenbehandlung gegenüber der Kontrollgruppe liegt. Gibt es einen Grund, warum wir Faktor-Scores der Skalierung von Summen oder Durchschnittswerten vorziehen könnten?
Um die Alternativen zu konkretisieren, nehmen Sie dieses einfache Beispiel:
library(lavaan)
library(devtools)
# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1 3 4 3 4 3 3 4 4 3
# 2 2 1 2 2 4 3 2 1 3
# 3 1 3 4 4 4 2 1 2 2
# 4 1 2 1 2 1 2 1 3 2
# 5 3 3 4 4 1 1 2 4 1
# 6 2 2 2 2 2 2 1 1 1
# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf
# non-refined -----------------------------------------------------------------
mydata$sumScore <- rowSums(mydata[, 1:9])
mydata$avgScore <- rowSums(mydata[, 1:9])/9
hist(mydata$avgScore)
# refined ---------------------------------------------------------------------
model <- '
tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
'
fit <- sem(model, data = mydata, meanstructure = TRUE,
missing = "pairwise", estimator = "WLSMV")
factorScore <- predict(fit)
hist(factorScore[,1])
They are more exact
Diese zusätzliche Betonung sollte uns nicht von der Tatsache ablenken, dass sogar Faktorwerte unweigerlich ungenau sind ("unterbestimmt").
"more exact"
. Unter den linear berechneten Faktorwerten ist die Regressionsmethode in dem Sinne "am genauesten mit den unbekannten wahren Faktorwerten korreliert" "am genauesten". Also ja, genauer (im linearen algebraischen Ansatz), aber nicht ganz genau.