In Bezug auf die Interpretation der Koeffizienten gibt es (unter anderem) einen Unterschied im Binärfall. Was sich zwischen GEE und GLMM unterscheidet, ist das Ziel der Inferenz: bevölkerungsdurchschnittlich oder fachspezifisch .
Betrachten wir ein einfaches erfundenes Beispiel, das mit Ihrem verwandt ist. Sie möchten die Ausfallrate zwischen Jungen und Mädchen in einer Schule modellieren. Wie bei den meisten (Grund-) Schulen ist die Schülerbevölkerung in Klassenräume unterteilt. Sie beobachten eine binäre Antwort von n i Kindern in N Klassenzimmern (dh ∑ N i = 1 n i binäre Antworten, die nach Klassenzimmern gruppiert sind), wobei Y i j = 1, wenn der Schüler j aus dem Klassenzimmer i bestand, und Y i j = 0, wenn er /Sie versagte. Und xYniN∑Ni=1niYij=1jiYij=0wenn der Schülerjaus dem Klassenzimmerimännlich ist und sonst 0.xij=1ji
Um die im ersten Absatz verwendete Terminologie wiederzugeben, können Sie sich die Schule als die Bevölkerung und die Klassenräume als die Fächer vorstellen .
Betrachten Sie zuerst GLMM. GLMM passt ein Modell mit gemischten Effekten an. Die Modellbedingungen in der festen Entwurfsmatrix (die in diesem Fall aus dem Achsenabschnitt und dem Indikator für das Geschlecht besteht) und alle zufälligen Effekte in den Klassenräumen, die wir in das Modell einbeziehen. In unserem Beispiel nehmen wir einen zufälligen Abschnitt , der die Grunddifferenzen bei der Ausfallrate zwischen Klassenräumen berücksichtigt. Also modellieren wirbi
log(P(Yij=1)P(Yij=0)∣xij,bi)=β0+β1xij+bi
bi
GEE passt dagegen ein Randmodell an. Diese modellhaften Bevölkerungsdurchschnitte . Sie modellieren die Erwartungshaltung nur nach Ihrer festen Entwurfsmatrix.
log(P(Yij=1)P(Yij=0)∣xij)=β0+β1xij
Dies steht im Gegensatz zu den oben erläuterten Mischeffektmodellen, die sowohl für die feste Entwurfsmatrix als auch für die Zufallseffekte gelten. Mit dem obigen Randmodell sagen Sie also: "Vergessen Sie den Unterschied zwischen den Klassenzimmern, ich möchte nur die (schulische) Versagensrate der Bevölkerung und ihre Assoziation mit dem Geschlecht." Sie passen zum Modell und erhalten eine Odds Ratio, die der bevölkerungsdurchschnittlichen Odds Ratio des geschlechtsspezifischen Versagens entspricht.
Sie können also feststellen, dass Ihre Schätzungen von Ihrem GEE-Modell möglicherweise von Ihren Schätzungen Ihres GLMM-Modells abweichen, und das liegt daran, dass sie nicht dasselbe schätzen.
(Was die Konvertierung von log-odds-ratio zu odds-ratio durch Exponentiieren betrifft, tun Sie dies, unabhängig davon, ob es sich um eine bevölkerungsbezogene oder eine fachspezifische Schätzung handelt.)
Einige Anmerkungen / Literatur:
Für den linearen Fall sind die Schätzungen für den Bevölkerungsdurchschnitt und die themenspezifischen Schätzungen gleich.
Zeger et al. 1988 zeigte, dass für die logistische Regression,
βM≈[(163√15π)2V+1]−1/2βRE
βMβREV
Molenberghs, Verbeke 2005 enthält ein ganzes Kapitel über Modelle mit Random-Effekten.
Ich habe in einem Kurs, der sehr stark von Diggle, Heagerty, Liang, Zeger 2002 abhängt, viel über dieses und verwandtes Material gelernt - eine großartige Referenz.