Bei der Modellierung von Strukturgleichungen mit latenten Variablen (SEM) lautet die gängige Modellformulierung "Multiple Indicator, Multiple Cause" (MIMIC), wobei eine latente Variable durch einige Variablen verursacht und von anderen reflektiert wird. Hier ist ein einfaches Beispiel:
Im Wesentlichen f1
ist ein Ergebnis für Regressions x1
, x2
und x3
, und y1
, y2
und y3
sind für die Messung Indikatoren f1
.
Man kann auch eine zusammengesetzte latente Variable definieren, wobei die latente Variable im Wesentlichen eine gewichtete Kombination ihrer konstituierenden Variablen darstellt.
Hier ist meine Frage: Gibt es einen Unterschied zwischen der Definition f1
als Regressionsergebnis und der Definition als zusammengesetztes Ergebnis in einem MIMIC-Modell?
Einige Tests mit lavaan
Software in R
zeigen, dass die Koeffizienten identisch sind:
library(lavaan)
# load/prep data
data <- read.table("http://www.statmodel.com/usersguide/chap5/ex5.8.dat")
names(data) <- c(paste("y", 1:6, sep=""), paste("x", 1:3, sep=""))
# model 1 - canonical mimic model (using the '~' regression operator)
model1 <- '
f1 =~ y1 + y2 + y3
f1 ~ x1 + x2 + x3
'
# model 2 - seemingly the same (using the '<~' composite operator)
model2 <- '
f1 =~ y1 + y2 + y3
f1 <~ x1 + x2 + x3
'
# run lavaan
fit1 <- sem(model1, data=data, std.lv=TRUE)
fit2 <- sem(model2, data=data, std.lv=TRUE)
# test equality - only the operators are different
all.equal(parameterEstimates(fit1), parameterEstimates(fit2))
[1] "Component “op”: 3 string mismatches"
Wie sind diese beiden Modelle mathematisch gleich? Mein Verständnis ist, dass Regressionsformeln in einem SEM sich grundlegend von zusammengesetzten Formeln unterscheiden, aber dieser Befund scheint diese Idee abzulehnen. Darüber hinaus ist es einfach, ein Modell zu erstellen, bei dem der ~
Operator nicht mit dem <~
Operator austauschbar ist (um die lavaan
Syntax zu verwenden). Normalerweise führt die Verwendung einer anstelle der anderen zu einem Modellidentifizierungsproblem, insbesondere wenn die latente Variable dann in einer anderen Regressionsformel verwendet wird. Wann sind sie austauschbar und wann nicht?
Rex Klines Lehrbuch (Prinzipien und Praxis der Strukturgleichungsmodellierung) spricht tendenziell über MIMIC-Modelle mit der Terminologie von Verbundwerkstoffen, aber Yves Rosseel, der Autor von lavaan
, verwendet den Regressionsoperator in jedem MIMIC-Beispiel, das ich gesehen habe, explizit.
Kann jemand dieses Problem klären?
f1 ~ x1 + x2 + x3
, aber Sie können habenf1 <~ x1 + x2 + x3
?