Um Ihre wörtliche Frage zu beantworten: "Ist es gültig, ein Basismaß als Kontrollvariable einzuschließen, wenn die Auswirkung einer unabhängigen Variablen auf die Änderungsergebnisse getestet wird?", Lautet die Antwort " Nein" . Die Antwort lautet Nein, da die Basisbewertung konstruktionsbedingt mit dem Fehlerterm korreliert, wenn die Änderungsbewertung als abhängige Variable verwendet wird. Daher ist der geschätzte Effekt der Basisbewertung auf die Änderungsbewertung nicht interpretierbar.
Verwenden
- Y1 als Anfangsgewicht
- Y2 als Endgewicht
- Δ Y = Y 2 - Y 1ΔY als Gewichtsänderung (dh )ΔY=Y2−Y1
- T als zufällig zugeordnete Behandlung und
- X als andere exogene Faktoren, die das Gewicht beeinflussen (z. B. andere Kontrollvariablen, die mit dem Ergebnis zusammenhängen, aber aufgrund einer zufälligen Zuordnung nicht mit der Behandlung korreliert werden sollten)
Man hat dann ein Modell, das auf und ; T XΔYTX
ΔY=β1T+β2X+e
Was per definitionem äquivalent ist zu;
Y2−Y1=β1T+β2X+e
Wenn Sie nun die Basislinie als Kovariate , sollte ein Problem auftreten, da Sie den Term auf beiden Seiten der Gleichung haben. Dies zeigt, dass nicht ist, da es inhärent mit dem Fehlerterm korreliert.β 3 Y 1Y1β3Y1
Y2−Y1Y2=β1T+β2X+β3Y1+e=β1T+β2X+β3Y1+(e+Y1)
Nun scheint ein Teil der Verwirrung in den verschiedenen Antworten auf die Tatsache zurückzuführen zu sein, dass verschiedene Modelle identische Ergebnisse für den Behandlungseffekt liefern , in meiner obigen Formulierung. Wenn man also den Behandlungseffekt für das Modell unter Verwendung von Änderungswerten als abhängige Variable mit dem Modell unter Verwendung der "Ebenen" vergleicht (wobei jedes Modell die Grundlinie als Kovariate enthält), ist die Interpretation des Behandlungseffekts die gleich. In den beiden folgenden Modellen sind und die darauf basierenden Schlussfolgerungen gleich (Bruce Weaver hat auch SPSS-Code veröffentlicht, der die Gleichwertigkeit demonstriert).Y 1 β 1 Tβ1TY1β1T
Change Score ModelLevels Model:Y2−Y1=β1T+β2X+β3Y1+e:Y2=β1T+β2X+β3Y1+e
Einige werden sich also streiten (wie Felix in diesem Thread und Bruce Weaver in einigen Diskussionen über die SPSS-Google-Gruppe)) Da die Modelle den gleichen geschätzten Behandlungseffekt haben, spielt es keine Rolle, welchen Sie wählen. Ich bin anderer Meinung, da die Basiskovariate im Änderungsbewertungsmodell nicht interpretiert werden kann, sollten Sie die Basiskovariate niemals als Kovariate einbeziehen (unabhängig davon, ob der geschätzte Behandlungseffekt derselbe ist oder nicht). Dies wirft also eine andere Frage auf: Was nützt es, die Änderungswerte als abhängige Variablen zu verwenden? Wie Felix bereits bemerkte, unterscheidet sich das Modell, das den Änderungswert als abhängige Variable ohne die Basislinie als Kovariate verwendet, von dem Modell, das die Ebenen verwendet. Zur Verdeutlichung werden in den nachfolgenden Modellen unterschiedliche Behandlungseffekte angegeben (insbesondere für den Fall, dass die Behandlung mit dem Ausgangswert korreliert).
Change Score Model Without BaselineLevels Model:Y2−Y1=β1T+β2X+e:Y2=β1T+β2X+β3Y1+e
Dies wurde in der Literatur als "Lord's Paradox" bezeichnet. Welches Modell ist also richtig? Nun, im Fall von randomisierten Experimenten würde ich sagen, dass das Levels-Modell vorzuziehen ist (obwohl der durchschnittliche Behandlungseffekt zwischen den Modellen sehr nahe sein sollte, wenn Sie eine gute Arbeit beim Randomisieren geleistet haben). Andere haben Gründe genannt, warum das Level-Modell vorzuziehen ist. Charlies Antwort macht einen guten Punkt darin, dass Sie Interaktionseffekte mit der Grundlinie im Level-Modell abschätzen können (aber nicht im Change-Score-Modell). Whuber zeigt in dieser Antwort auf eine sehr ähnliche Frage, wie die Änderungswerte Korrelationen zwischen verschiedenen Behandlungen induzieren.
In Situationen, in denen die Behandlung nicht zufällig zugeordnet wird, sollte das Modell, das Änderungswerte als abhängige Variable verwendet, stärker berücksichtigt werden. Der Hauptvorteil des Change-Score-Modells besteht darin, dass jederzeit invariante Prädiktoren des Ergebnisses kontrolliert werden. Angenommen, in der obigen Formulierung ist über die gesamte Zeit konstant (zum Beispiel, wenn eine genetische Veranlagung ein bestimmtes Gewicht hat), und korreliert damit, ob eine Person trainiert (und nicht beobachtet wird). In diesem Fall ist das Änderungsbewertungsmodell vorzuziehen. Auch in Fällen, in denen die Auswahl in die Behandlung mit dem Grundlinienwert korreliert, kann das Änderungsbewertungsmodell vorzuziehen sein. Paul Allison in seiner Zeitung,XXXDie Ergebnisse als abhängige Variablen in der Regressionsanalyse ändern , enthält dieselben Beispiele (und hat meine Sichtweise auf das Thema stark beeinflusst, daher empfehle ich dringend, sie zu lesen).
Das soll nicht heißen, dass Änderungsergebnisse in nicht zufälligen Einstellungen immer vorzuziehen sind. In dem Fall, dass Sie erwarten, dass die Baseline einen tatsächlichen kausalen Effekt auf das Post-Gewicht hat, sollten Sie das Level-Modell verwenden. Wenn Sie erwarten, dass die Baseline einen kausalen Effekt hat und die Auswahl der Behandlung mit der Baseline korreliert, wird der Behandlungseffekt mit dem Baseline-Effekt verwechselt.
Ich habe die Anmerkung von Charlie ignoriert, dass der Logarithmus des Gewichts als abhängige Variable verwendet werden könnte. Ich bezweifle zwar nicht, dass dies eine Möglichkeit sein könnte, aber es ist keine Folge der ursprünglichen Frage. In einer anderen Frage wurde erörtert, wann die Logarithmen der Variablen verwendet werden sollten (und diese gelten in diesem Fall immer noch). Es gibt wahrscheinlich bereits Literatur zu diesem Thema, anhand derer Sie feststellen können, ob die Verwendung des protokollierten Gewichts ebenfalls angemessen ist.
Zitat
Allison, Paul D. 1990. Änderungswerte als abhängige Variablen in der Regressionsanalyse . Sociological Methodology 20: 93 & ndash; 114. Öffentliche PDF-Version .