Auf der ersten Ebene denke ich, dass Sie alles ignorieren, was zu einer Schrumpfung der Bevölkerungswerte führt. " Die Steigungen und Abschnitte pro Subjekt aus dem Modell mit gemischten Effekten liegen näher an den Bevölkerungsschätzungen als die Schätzungen der kleinsten Quadrate innerhalb des Subjekts. " [Ref. 1]. Der folgende Link wird wahrscheinlich auch hilfreich sein ( Was sind die richtigen Beschreibungen für meine gemischten Modelle? ), Siehe Mike Lawrences Antwort).
Darüber hinaus denke ich, dass Sie in Ihrem Spielzeugbeispiel etwas Pech haben, weil Sie ein perfekt ausbalanciertes Design haben, das dazu führt, dass Sie genau die gleiche Schätzung haben, wenn keine Werte fehlen.
Versuchen Sie den folgenden Code, der denselben Prozess ohne fehlenden Wert hat:
cat <- as.factor(sample(1:5, n*k, replace=T) ) #This should be a bit unbalanced.
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits= 7,fixef(m3)) == round(digits=7, coef(m1)) #Not this time lad.
#(Intercept) x
# FALSE FALSE
Wo jetzt, weil Ihr Design nicht perfekt ausbalanciert ist, haben Sie nicht die gleichen Koeffizientenschätzungen.
Wenn Sie auf dumme Weise mit Ihrem fehlenden Wertemuster spielen (zum Beispiel :), y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
damit Ihr Design immer noch perfekt ausbalanciert ist, erhalten Sie wieder dieselben Koeffizienten.
require(nlme)
set.seed(128)
n <- 100
k <- 5
cat <- as.factor(rep(1:k, each = n))
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
plot(x, y)
# simulate missing data in a perfectly balanced way
y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits=7,fixef(m3)) == round(digits=7, coef(m1)) #Look what happend now...
#(Intercept) x
# TRUE TRUE
Sie werden durch das perfekte Design Ihres ursprünglichen Experiments geringfügig irregeführt. Wenn Sie die NAs in einem nicht ausgeglichenen Abstand einfügen, haben Sie das Muster geändert, wie viel "Stärke" die einzelnen Probanden voneinander leihen können.
Kurz gesagt, die Unterschiede, die Sie sehen, sind auf Schrumpfeffekte zurückzuführen, insbesondere darauf, dass Sie Ihr ursprüngliches perfekt ausbalanciertes Design mit nicht perfekt ausbalancierten fehlenden Werten verzerrt haben.
Ref 1: Douglas Bates lme4: Modellierung mit gemischten Effekten mit R , Seiten 71-72
m3
es 0,0011713" stattm2
.