Ich analysiere derzeit Daten aus einer Reihe von Verhaltensexperimenten, die alle das folgende Maß verwenden. Die Teilnehmer dieses Experiments werden gebeten, Hinweise auszuwählen, mit deren Hilfe (fiktive) andere Personen eine Reihe von 10 Anagrammen lösen können. Die Teilnehmer werden glauben gemacht, dass diese anderen Menschen entweder Geld gewinnen oder verlieren werden, abhängig von ihrer Leistung beim Lösen der Anagramme. Die Anhaltspunkte unterscheiden sich darin, wie hilfreich sie sind. Zum Beispiel könnten für das Anagramm NUNGRIN, ein Anagramm von RUNNING, drei Hinweise sein:
- Schnell bewegen (nicht hilfreich)
- Was machst du bei einem Marathonlauf? (Hilfreich)
- Nicht immer ein gesundes Hobby (nicht hilfreich)
Um die Messung zu bilden, zähle ich, wie oft (von 10) ein Teilnehmer einen nicht hilfreichen Hinweis für die andere Person auswählt. In den Experimenten benutze ich verschiedene Manipulationen, um die Nützlichkeit der von den Leuten ausgewählten Hinweise zu beeinflussen.
Da die Hilfsbereitschafts- / Nicht-Hilfsbereitschaftsmessung ziemlich stark positiv verzerrt ist (ein großer Teil der Benutzer wählt immer die 10 hilfreichsten Hinweise aus) und weil die Messung eine Zählvariable ist, habe ich ein verallgemeinertes lineares Modell von Poisson verwendet, um diese Daten zu analysieren. Als ich jedoch noch etwas mehr über die Poisson-Regression las, stellte ich fest, dass die Poisson-Regression den Mittelwert und die Varianz einer Verteilung nicht unabhängig voneinander schätzt und die Varianz in einem Datensatz häufig unterschätzt. Ich begann Alternativen zur Poisson-Regression zu untersuchen, wie zum Beispiel die Quasipoisson-Regression oder die negative binomiale Regression. Allerdings gebe ich zu, dass ich mit solchen Modellen noch nicht so vertraut bin. Deshalb komme ich hierher, um Rat zu holen.
Hat jemand Empfehlungen, welches Modell für diese Art von Daten verwendet werden soll? Gibt es noch andere Überlegungen, die ich berücksichtigen sollte (ist beispielsweise ein bestimmtes Modell leistungsfähiger als ein anderes?)? Auf welche Art von Diagnose sollte ich achten, um festzustellen, ob das ausgewählte Modell meine Daten angemessen verarbeitet?