Zunächst werde ich in meiner Antwort noch ein viertes Modell für die Diskussion vorstellen:
fit1.5 <- lm (y_2 ~ x_1 + x_2 + y_1)
Teil 0
Der Unterschied zwischen fit1 und fit1.5 lässt sich am besten als Unterschied zwischen einem eingeschränkten Unterschied und einem optimalen Unterschied zusammenfassen.
Ich werde dies anhand eines einfacheren Beispiels erklären als das oben angegebene. Beginnen wir mit fit1.5. Eine einfachere Version des Modells wäre
. Wenn wir eine OLS-Schätzung erhalten, findet es natürlich die "optimale" Wahl für . Und obwohl es seltsam erscheint, als solches zu schreiben, könnten wir die Formel als umschreiben.
Wir können uns dies als den "optimalen" Unterschied zwischen den beiden Variablen vorstellen.
y2=b0+b1⋅x+b2⋅y1
b2y2−b2⋅y1=b0+b1⋅x
y
Wenn wir uns nun entscheiden, zu beschränken , wird die Formel / das Modell zu
was nur die (eingeschränkte) Differenz ist.b2=1
y2−y1=b0+b1⋅x
Beachten Sie, dass in der obigen Demonstration, wenn Sie eine dichotome Variable und eine Pre-Test- und eine Post-Test-Score-Paarung sein lassen, das eingeschränkte Differenzmodell nur der unabhängige Stichproben- Test für den Score-Gewinn ist Das optimale Differenzmodell wäre der ANCOVA-Test, wobei die Ergebnisse vor dem Test als Kovariaten verwendet werden.xy1y2t
Teil 1
Das Modell für fit2 kann am besten auf ähnliche Weise wie der oben verwendete Differenzansatz betrachtet werden. Obwohl dies eine übermäßige Vereinfachung ist (da ich die Fehlerterme ), könnte das Modell als
wobei für die Werte und für die Werte . Hier ist die Vereinfachung ... hier schreiben wir
Anders geschrieben, . Während das Modell fit1.5 als Wert hatte, um den optimalen Unterschied für die OLS-Analyse zu erzielen , ist hiert = 0 y 1 t = 1 y 2 y 1
y=b0+b1⋅x+b2⋅t
t=0y1t=1y2 y2-y1=b2b2b2yy1y2=b0+b1⋅x=b0+b1⋅x+b2
y2−y1=b2b2b2ist im Wesentlichen nur die durchschnittliche Differenz zwischen den Werten (nach Kontrolle der anderen Kovariaten).
y
Teil 2
Was ist also der Unterschied zwischen den Modellen fit2 und fit3 ... eigentlich sehr wenig. Das fit3-Modell berücksichtigt zwar die Korrelation in Bezug auf Fehler, dies ändert jedoch nur den Schätzprozess, und daher sind die Unterschiede zwischen den beiden Modellausgaben minimal (über die Tatsache hinaus, dass das fit3 den autoregressiven Faktor schätzt).
Teil 2.5
Und ich werde noch ein weiteres Modell in diese Diskussion einbeziehen
fit4 <- lmer (y ~ Zeit + x1 + x2 + (1 | id), Daten = df.long)
Dieses Modell mit gemischten Effekten führt eine etwas andere Version des autoregressiven Ansatzes aus. Wenn wir den Zeitkoeffizienten in die zufälligen Effekte einbeziehen würden, wäre dies vergleichbar mit der Berechnung der Differenz zwischen den für jedes Subjekt. (Aber das wird nicht funktionieren ... und das Modell läuft nicht.)y
Holland, Paul & Donald Rubin. 1983. On Lord’s Paradox. In Principles of modern psychological measurement: A festchrift for Frederic M. Lord edited by Wainer, Howard & Samuel Messick pgs:3-25. Lawrence Erlbaum Associates. Hillsdale, NJ.