Ich bin ein Epidemiologe, der versucht, GEEs zu verstehen, um eine Kohortenstudie richtig zu analysieren (unter Verwendung der Poisson-Regression mit einem Log-Link, um das relative Risiko abzuschätzen). Ich habe ein paar Fragen zur "funktionierenden Korrelation", die ich von einem Fachmann klären lassen möchte:
(1) Ist es in der Regel am sinnvollsten, eine austauschbare Struktur anzunehmen, wenn ich bei derselben Person wiederholte Messungen durchgeführt habe? (Oder ein Autoregressiv, wenn Messungen einen Trend zeigen)? Was ist mit Unabhängigkeit - gibt es Fälle, in denen man für Messungen an ein und derselben Person Unabhängigkeit annehmen könnte?
(2) Gibt es eine (einigermaßen einfache) Möglichkeit, die ordnungsgemäße Struktur durch Prüfung der Daten zu beurteilen?
(3) Ich habe festgestellt, dass ich bei der Auswahl einer Unabhängigkeitsstruktur die gleichen Punktschätzungen erhalte (aber geringere Standardfehler) wie bei der Ausführung einer einfachen Poisson-Regression (mit R, Funktion glm()
und geeglm()
aus Paket geepack
). Warum passiert das? Ich verstehe, dass Sie mit GEEs ein bevölkerungsgemitteltes Modell schätzen (im Gegensatz zu subjektspezifisch), sodass Sie nur im Fall der linearen Regression die gleichen Punktschätzungen erhalten sollten.
(4) Wenn sich meine Kohorte an mehreren Standorten befindet (aber eine Messung pro Person), sollte ich eine Unabhängigkeit oder eine austauschbare Arbeitskorrelation wählen und warum? Ich meine, Individuen an jedem Standort sind immer noch unabhängig voneinander, oder? So würde ich zum Beispiel für ein fachspezifisches Modell die Site als zufälligen Effekt angeben. Bei GEE ergeben Unabhängigkeit und Austauschbarkeit jedoch unterschiedliche Schätzungen, und ich bin nicht sicher, welche hinsichtlich der zugrunde liegenden Annahmen besser ist.
(5) Kann GEE ein hierarchisches Clustering auf 2 Ebenen durchführen, dh eine Kohorte mit mehreren Standorten mit wiederholten Messungen pro Person? Wenn ja, was sollte ich als Clustering-Variable angeben geeglm()
und wie sollte die funktionierende Korrelation aussehen, wenn man zum Beispiel "Unabhängigkeit" für die erste Ebene (Standort) und "austauschbar" oder "autoregressiv" für die zweite Ebene (individuell) annimmt?
Ich verstehe, dass dies eine ganze Reihe von Fragen sind, von denen einige recht einfach sind, aber für mich (und vielleicht auch für andere Neulinge?) Immer noch sehr schwierig zu erfassen sind. Daher wird jede Hilfe sehr und aufrichtig geschätzt, und um dies zu zeigen, habe ich ein Kopfgeld ausgesetzt.