Die Abweichung ist ein GLM-Konzept. ZIP- und ZINB-Modelle sind keine glms, sondern werden als endliche Mischungen von Verteilungen formuliert, die GLMs sind und daher einfach über einen EM-Algorithmus gelöst werden können.
Diese Anmerkungen beschreiben die Theorie der Abweichung kurz. Wenn Sie diese Notizen lesen, sehen Sie den Beweis, dass das gesättigte Modell für die Poisson-Regression eine logarithmische Wahrscheinlichkeit aufweist
ℓ ( λs) = ∑i = 1 , ∀ yich≠ 0n[ yichl o g( yich) - yich- l o g( yich! ) ]
Dies ergibt sich aus den Plug-In-Schätzungen .yich= λ^ich
Ich werde jetzt mit der ZIP-Wahrscheinlichkeit fortfahren, da die Mathematik einfacher ist und ähnliche Ergebnisse für die ZINB gelten. Leider gibt es für die ZIP keine einfache Beziehung wie im Poisson. Die te Beobachtungsprotokollwahrscheinlichkeit istich
ℓich( ϕ , λ ) = Z.ichl o g( ϕ + ( 1 - ϕ ) e- λ) + ( 1 - Z.ich) [ - λ + yichl o g(λ)−log(yi!)].
Ziλϕλϕyi=0λ^ϕ^Ziyi=0ZiWert Wir würden kein ZIP-Modell benötigen, da wir keine fehlenden Daten hätten. Die beobachteten Daten entsprechen der Wahrscheinlichkeit "vollständiger Daten" im EM-Formalismus.
ZiE(ℓi(ϕ,λ))Ziexpected
Auch diese Frage wurde zuerst gestellt, also habe ich diesen Beitrag beantwortet. Es gibt jedoch eine andere Frage zum gleichen Thema mit einem netten Kommentar von Gordon Smyth hier:
Abweichung für das nicht aufgeblasene zusammengesetzte Poisson-Modell, kontinuierliche Daten (R),
bei der er dieselbe Antwort erwähnte (dies ist eine Ausarbeitung dieses Kommentars, den ich hätte sagen) und sie erwähnten in den Kommentaren zum anderen Beitrag ein Papier, das Sie vielleicht lesen möchten. (Haftungsausschluss, ich habe das referenzierte Papier nicht gelesen)