Verwenden Sie GEE, wenn Sie den durchschnittlichen Effekt einer Kovariate im Vergleich zum individuellen Effekt ermitteln möchten. Diese beiden Dinge sind nur in linearen Modellen äquivalent, nicht jedoch in nichtlinearen (z. B. logistischen). Um dies zu sehen, nehmen Sie zum Beispiel das logistische Zufallseffektmodell der -ten Beobachtung des -ten Subjekts, ;i y i jjichY.ich j
log(pij1−pij)=μ+ηi
Dabei ist ein zufälliger Effekt für das Subjekt und .ηi∼N(0,σ2)ipij=P(Yij=1|ηi)
Wenn Sie ein Zufallseffektmodell für diese Daten verwenden, erhalten Sie eine Schätzung von , die die Tatsache berücksichtigt, dass auf jedes Individuum eine normalverteilte Störung mit einem Mittelwert von Null angewendet wurde, wodurch es für jedes Individuum spezifisch wird.μ
Wenn Sie GEE für diese Daten verwenden, würden Sie die durchschnittlichen Log-Quoten der Grundgesamtheit schätzen. In diesem Fall wäre das
ν=log⎛⎝⎜Eη(11+e−μ−ηi)1−Eη(11+e−μ−ηi)⎞⎠⎟
ν≠μ , im Allgemeinen. Wenn zum Beispiel und , dann . Obwohl die zufälligen Effekte auf der transformierten (oder verknüpften ) Skala einen Mittelwert von Null haben , ist ihr Effekt auf der ursprünglichen Skala der Daten nicht gleich Null. Versuchen Sie, einige Daten aus einem logistischen Regressionsmodell mit gemischten Effekten zu simulieren und den Bevölkerungsdurchschnitt mit dem Invers-Logit des Abschnitts zu vergleichen, und Sie werden feststellen, dass sie nicht gleich sind, wie in diesem Beispiel. Dieser Unterschied in der Interpretation der Koeffizienten ist der grundlegende Unterschied zwischen GEE- und Zufallseffektmodellen .μ=1σ2=1ν≈.83
Bearbeiten: Im Allgemeinen kann ein Modell mit gemischten Effekten ohne Prädiktoren als geschrieben werden
ψ(E(Yij|ηi))=μ+ηi
Dabei ist eine Verknüpfungsfunktion. Wann immerψ
ψ(Eη(ψ−1(E(Yij|ηi))))≠Eη(E(Yij|ηi))
Es wird einen Unterschied zwischen den Populationsdurchschnittskoeffizienten (GEE) und den einzelnen spezifischen Koeffizienten (Zufallseffektmodelle) geben. Das heißt, die Durchschnittswerte ändern sich, indem die Daten transformiert, die zufälligen Effekte auf der transformierten Skala integriert und dann zurücktransformiert werden. Beachten Sie, dass im linearen Modell ( ) die Gleichheit gilt, sodass sie äquivalent sind.ψ(x)=x
Bearbeiten 2: Es ist auch erwähnenswert, dass die von einem GEE-Modell erzeugten "robusten" Standardfehler vom Sandwich-Typ gültige asymptotische Konfidenzintervalle liefern (z. B. decken sie tatsächlich 95% der Zeit ab), auch wenn die im Modell angegebene Korrelationsstruktur nicht vorliegt richtig.
Bearbeiten 3: Wenn Sie die Assoziationsstruktur in den Daten verstehen möchten, sind die GEE-Schätzungen der Assoziationen notorisch ineffizient (und manchmal inkonsistent). Ich habe eine Referenz dafür gesehen, kann sie aber derzeit nicht platzieren.