Welches Modell eignet sich für unzureichende Zähldaten?


24

Ich versuche, Zähldaten in R zu modellieren , die scheinbar unterdispers sind (Dispersionsparameter ~ .40). Dies ist wahrscheinlich der Grund, warum ein glmwith- family = poissonoder ein negatives binomial ( glm.nb) -Modell nicht signifikant sind. Wenn ich mir die Beschreibungen meiner Daten anschaue, habe ich nicht den typischen Versatz der Zähldaten und die Residuen in meinen beiden Versuchsbedingungen sind auch homogen.

Meine Fragen sind also:

  1. Muss ich für meine Zähldaten sogar spezielle Regressionsanalysen verwenden, wenn sich meine Zähldaten nicht wirklich wie Zähldaten verhalten? Manchmal stelle ich eine Nichtnormalität fest (normalerweise aufgrund der Kurtosis), aber ich habe die Perzentil-Bootstrap-Methode zum Vergleichen der Mittelwerte verwendet (Wilcox, 2012), um die Nichtnormalität zu berücksichtigen. Können Methoden zur Zählung von Daten durch eine von Wilcox vorgeschlagene und im WRS-Paket umgesetzte robuste Methode ersetzt werden?

  2. Wie kann ich die Unterdispersion berücksichtigen, wenn ich Regressionsanalysen für Zählungsdaten verwenden muss? Das Poisson und die negative Binomialverteilung nehmen eine höhere Streuung an, also sollte das nicht angemessen sein, oder? Ich habe darüber nachgedacht, die Quasi-Poisson- Verteilung anzuwenden , aber dies wird normalerweise für eine Überdispersion empfohlen. Ich habe etwas über Beta-Binomial- Modelle gelesen , die sowohl Über- als auch Unterdispersionen zu berücksichtigen VGAMscheinen. Die Autoren scheinen jedoch eine getitelte Poisson-Distribution zu empfehlen , aber ich kann sie nicht im Paket finden .

Kann jemand eine Prozedur für unterdisperse Daten empfehlen und vielleicht ein Beispiel für R-Code dafür bereitstellen?


1
Woher wissen Sie, dass Ihre Daten nicht dispergiert sind? Wie berechnen Sie den Dispersionsparameter?
Hong Ooi

1
Es würde auch helfen, uns mehr über das zu erzählen, woran Sie interessiert sind. Für lineare Vorhersagepunktschätzungen und Vorhersagen von Werten ist eine Unterdispersion selten ein Problem, aber Tests und Intervalle können unnötig konservativ sein (Quasi-Familien würden dabei helfen). Für einen "normalen" Likelihood-Ansatz sollten Sie jedoch COM Poisson und andere verallgemeinerte Poisson-Modelle prüfen.
Momo

@ Hung Ooi: Ich habe die Dispersion mit Dispersionstest (Poissonmodel, Alternative = c ("weniger")) getestet und der Test hat sich als signifikant erwiesen.
Sil

1
@ Momo: Ich möchte testen, ob sich die Verhandlungs-Dyaden unter zwei experimentellen Bedingungen in den richtigen Angeboten unterscheiden, die sie machen. Richtige Angebote bedeuten, dass Dyaden mehr Probleme geltend machen, die den jeweiligen Interessen ihrer Teams entsprechen, anstatt Probleme zu fordern, die für die andere Partei wertvoller sind. Erstens war mir gar nicht bewusst, dass dies Zähldaten sind. Meinen Sie die Conway-Maxwell-Poisson-Distribution von COM Poisson? Vielen Dank schon jetzt!
Sil

3
Danke für die zusätzlichen Infos. Ja, ich meinte das Conway-Maxwell-Poisson. Shmueli & Co hat ein verallgemeinertes lineares Modell dafür entwickelt. Es gibt auch ein R-Paket, wenn Sie es versuchen möchten.
Momo

Antworten:


9

Die beste --- und Standardmethode für den Umgang mit unterdispersen Poisson-Daten ist die Verwendung eines verallgemeinerten Poisson- oder vielleicht eines Hürdenmodells. Drei Parameterzählungsmodelle können auch für nicht dispergierte Daten verwendet werden. zB Faddy-Smith, Waring, Famoye, Conway-Maxwell und andere verallgemeinerte Zählermodelle. Der einzige Nachteil dabei ist die Interpretierbarkeit. Für allgemeine unterdisperse Daten sollte jedoch das verallgemeinerte Poisson verwendet werden. Es ist wie ein negatives Binomial für überdisperse Daten. In zwei meiner Bücher, Modelling Count Data (2014) und Negative Binomial Regression, 2. Auflage, (2011), die beide von Cambridge University Press herausgegeben wurden, werde ich darauf näher eingehen. In R ermöglicht das VGAM-Paket eine generalisierte Poisson-Regression (GP). Negative Werte des Dispersionsparameters zeigen eine Anpassung für eine Unterdispersion an. Sie können das GP-Modell auch für überdisperse Daten verwenden. Im Allgemeinen ist das NB-Modell jedoch besser. Wenn es darauf ankommt, ist es am besten, die Ursache für die Unterdispersion zu bestimmen und dann das am besten geeignete Modell auszuwählen, um damit umzugehen.


Willkommen zurück! Registrieren Sie sich und / oder führen Sie Ihre Konten zusammen (Informationen dazu finden Sie im Abschnitt " Mein Konto " in unserer Hilfe ). Anschließend können Sie Ihre eigene Frage bearbeiten und kommentieren. (Dein ursprünglicher Account ist hier .)
gung - Wiedereinsetzung von Monica

Können Sie eine verallgemeinerte Poisson-Analyse für SPSS durchführen?
Grace Carroll

3

Ich bin einmal auf einen unterstreuten Poisson gestoßen, der mit der Häufigkeit zu tun hatte, mit der Leute ein soziales Spiel spielten. Es stellte sich heraus, dass dies an der extremen Regelmäßigkeit lag, mit der die Leute freitags spielten. Durch das Entfernen der Freitagsdaten habe ich das erwartete überdisperse Poisson erhalten. Vielleicht haben Sie die Möglichkeit, Ihre Daten auf ähnliche Weise zu bearbeiten.


1

Es gibt Situationen, in denen eine Unterdispersion mit einer Null-Inflation verschmilzt, was typisch ist für die Anzahl der bevorzugten Kinder bei Personen beiderlei Geschlechts. Ich habe bisher keine Möglichkeit gefunden, dies zu erfassen

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.