Offsets können in jedem Regressionsmodell verwendet werden, kommen jedoch viel häufiger vor, wenn Sie mit Zählungsdaten für Ihre Antwortvariable arbeiten. Ein Offset ist nur eine Variable, die im Modell einen Koeffizienten von . (Siehe auch diesen ausgezeichneten CV-Thread: Wann wird ein Offset in einer Poisson-Regression verwendet? ) 1
Bei korrekter Verwendung mit Zählungsdaten können Sie damit Raten anstelle von Zählungen modellieren . Wenn das von Interesse ist, ist es etwas zu tun. Dies ist also der Kontext, in dem Offsets am häufigsten verwendet werden. Betrachten wir einen Poisson-GLiM mit einer Protokollverknüpfung (die die kanonische Verknüpfung ist).
ln(λ)ln(λtime)ln(λ)−ln(time)ln(λ)ln(λ)=β0+β1X=β0+β1X⇒=β0+β1X=β0+β1X+1×ln(time)≠=β0+β1X+β2×ln(time)when β2≠1(counts)(rates)(still rates)(counts again)
(Wie Sie sehen können, besteht der Schlüssel zur korrekten Verwendung eines Versatzes darin, den Versatz und nicht .) t i m eln(time)time
Wenn der Koeffizient für nicht , werden keine Raten mehr modelliert. Da jedoch eine viel größere Flexibilität für die Anpassung der Daten bietet, werden Modelle, die als Versatz verwenden, dies normalerweise tun passen besser (obwohl sie auch überpassen können). 1 β 2 ∈ ( - ∞ , 1 ) ∪ ( 1 , ∞ ) ln ( t i m e )ln(time)1β2∈ ( - ∞ , 1 )∪(1,∞)ln( t i m e )
Ob Sie Zählungen oder Raten modellieren sollten, hängt wirklich von Ihrer inhaltlichen Frage ab. Sie sollten diejenige modellieren, die dem entspricht, was Sie wissen möchten.
Was es bedeuten könnte, dass nicht , betrachten Sie ein Beispiel, in dem die Zeit nicht die fragliche Variable ist. Stellen Sie sich vor, Sie untersuchen die Anzahl der chirurgischen Komplikationen in verschiedenen Krankenhäusern. In einem Krankenhaus wurden viel mehr chirurgische Komplikationen gemeldet, aber sie könnten behaupten, dass der Vergleich nicht fair ist, weil sie viel mehr Operationen durchführen. Also beschließen Sie, dies zu kontrollieren. Sie können einfach das Protokoll der Anzahl der Operationen als Offset verwenden, um die Komplikationsrate pro Operation zu untersuchen. Sie können auch das Protokoll der Anzahl der Operationen als eine andere Kovariate verwenden. Angenommen, der Koeffizient unterscheidet sich erheblich von . Ifβ211β2> 1Dann haben die Krankenhäuser, die mehr Operationen durchführen, eine höhere Komplikationsrate (möglicherweise, weil sie die Arbeit beschleunigen, um mehr zu erledigen). Wenn , haben die Krankenhäuser mit den meisten Komplikationen weniger pro Operation (vielleicht haben sie die besten Ärzte, und deshalb tun sie mehr und verbessern sie). β2< 1
Zu sehen, wie dies passieren könnte, wenn die fragliche Variable Zeit wäre, ist etwas komplizierter. Die Poisson-Verteilung ergibt sich aus dem Poisson-Prozess , bei dem die Zeit zwischen Ereignissen exponentiell verteilt ist und daher ein natürlicher Zusammenhang zur Überlebensanalyse besteht. In der Überlebensanalyse ist die Zeit bis zu Ereignissen häufig nicht exponentiell verteilt, aber das Grundrisiko kann mit der Zeit größer oder kleiner werden. Stellen Sie sich daher einen Fall vor, in dem Sie die Anzahl der Ereignisse modellieren, die nach einem natürlichen Ausgangspunkt auftreten. Wenn , bedeutet dies, dass sich die Ereignisrate beschleunigt, während bedeutet, dass sich die Ereignisrate verlangsamt. β2> 1β2< 1
Stellen Sie sich als konkretes Beispiel ein Scan vor, bei dem die Anzahl der Krebszellen in einem Zeitraum nach der chirurgischen Entfernung des ursprünglichen Tumors gezählt wird. Für einige Patienten ist seit der Operation mehr Zeit vergangen, und Sie wollten dies berücksichtigen. Da ein Krebs, sobald er wieder Fuß gefasst hat, exponentiell zu wachsen beginnt, steigt die Rate im Laufe der Zeit seit der Operation ohne zusätzliche Behandlung.
Betrachten Sie als konkretes Beispiel die Anzahl der Menschen, die an einem Krankheitsausbruch sterben, für den wir keine Behandlung haben. Zuerst sterben viele Menschen, weil sie anfälliger für diese Krankheit waren oder bereits ein geschwächtes Immunsystem hatten. Mit der Zeit wird die Rate sinken, da die verbleibende Bevölkerung weniger anfällig für die Krankheit ist. (Sorry, dieses Beispiel ist so krankhaft.)