Wenn Sie an der Wahrscheinlichkeit eines Vorfalls bei Patienten auf der Station in N Tagen interessiert sind, möchten Sie ein Modell, das entweder wie folgt aussieht:
mod1 <- glm(incident ~ 1, offset=patients.on.ward, family=binomial)
Der Versatz stellt Versuche dar, incident
ist entweder 0 oder 1, und die Wahrscheinlichkeit eines Vorfalls ist konstant (keine Heterogenität in der Tendenz, Vorfälle zu verursachen), und die Patienten interagieren nicht, um Vorfälle zu verursachen (keine Ansteckung). Wenn die Wahrscheinlichkeit eines Vorfalls für Sie gering ist (oder Sie die Anzahl der Vorfälle begrenzt haben, ohne uns darauf hinzuweisen), bevorzugen Sie möglicherweise die Poisson-Formulierung
log.patients.on.ward <- log(patients.on.ward)
mod2 <- glm(incident ~ 1, offset=log.patients.on.ward, family=poisson)
wo die gleichen Annahmen gelten. Der Offset wird protokolliert, da die Anzahl der stationären Patienten proportional / multiplikativ wirkt.
Wenn Sie das zweite Modell erweitern, denken Sie vielleicht, dass es mehr Vorfälle gibt, als dies allein aufgrund der höheren Patientenzahlen zu erwarten wäre. Das heißt, vielleicht interagieren die Patienten miteinander oder sind heterogen. Also versuchst du es
mod3 <- glm(incident ~ 1 + log.patients.on.ward, family=poisson)
Wenn sich der Koeffizient log.patients.on.ward
von 1, in dem er festgelegt wurde mod2
, erheblich unterscheidet, kann tatsächlich etwas mit Ihren Annahmen über keine Heterogenität und keine Ansteckung falsch sein. Und obwohl Sie diese beiden Variablen natürlich nicht unterscheiden können (und auch keine von anderen fehlenden Variablen), haben Sie jetzt eine Schätzung, um wie viel mehr Patienten auf der Station die Rate / Wahrscheinlichkeit eines Vorfalls erhöht, als Sie möchten Erwarten Sie vom Zufall. Im Bereich der Parameter ist es 1-coef(mod3)[2]
mit Intervall ableitbar confint
.
Alternativ können Sie auch direkt mit der Log-Menge und ihrem Koeffizienten arbeiten. Wenn Sie die Wahrscheinlichkeit eines Vorfalls nur anhand der Anzahl der Patienten auf der Station vorhersagen möchten, ist dieses Modell eine einfache Möglichkeit, dies zu tun.
Die Fragen
Ist es in Ordnung, abhängige Variablen in Ihrem Offset zu haben? Es klingt für mich nach einer sehr schlechten Idee, aber ich sehe nicht, dass Sie das müssen.
Der Offset in Poisson-Regressionsmodellen für exposure
ist in der Tat log(exposure)
. Vielleicht verwirrend ist die Verwendung offset
in Rs Binomial-Regressionsmodellen im Grunde genommen ein Hinweis auf die Anzahl der Versuche. Es kann immer durch eine abhängige Variable ersetzt werden, die als cbind(incidents, patients.on.ward-incidents)
und ohne Offset definiert ist. Stellen Sie es sich folgendermaßen vor: Im Poisson-Modell wird es rechts hinter der Protokollverknüpfungsfunktion und im Binomial-Modell links vor der Protokollverknüpfungsfunktion eingegeben.