Bei der Modellierung von Anspruchszählungsdaten in einer Versicherungsumgebung begann ich mit Poisson, bemerkte dann aber eine Überdispersion. Ein Quasi-Poisson-Modell modellierte die größere Mittelwert-Varianz-Beziehung besser als das Basis-Poisson-Modell, aber ich bemerkte, dass die Koeffizienten sowohl im Poisson- als auch im Quasi-Poisson-Modell identisch waren.
Wenn dies kein Fehler ist, warum geschieht dies? Was ist der Vorteil von Quasi-Poisson gegenüber Poisson?
Dinge zu beachten:
- Die zugrunde liegenden Verluste sind überschüssig, was (glaube ich) das Funktionieren des Tweedie verhinderte - aber es war die erste Distribution, die ich ausprobierte. Ich habe auch NB-, ZIP-, ZINB- und Hurdle-Modelle untersucht, aber trotzdem festgestellt, dass der Quasi-Poisson die beste Passform bietet.
- Ich habe mittels Dispersionstest im VRE-Paket auf Überdispersion getestet. Mein Dispersionsparameter betrug ungefähr 8,4 mit einem p-Wert bei der 10 ^ -16-Größe.
- Ich verwende glm () mit family = poisson oder quasipoisson und einem Protokolllink für Code.
- Beim Ausführen des Poisson-Codes erhalte ich die Warnung "In dpois (y, mu, log = TRUE): nicht ganzzahliges x = ...".
Hilfreiche SE-Threads nach Ben's Anleitung:
counts/exposure
. Stattdessen sollten Sie offset(log(exposure))
Ihren Modellen einen offset ( ) - Term hinzufügen .