Ich bin auf eine Reihe praktischer Fragen gestoßen, wenn ich Zähldaten aus experimenteller Forschung mithilfe eines subjektinternen Experiments modelliere. Ich beschreibe kurz das Experiment, die Daten und das, was ich bisher gemacht habe, gefolgt von meinen Fragen.
Einer Stichprobe von Befragten wurden nacheinander vier verschiedene Filme gezeigt. Nach jedem Film wurde ein Interview geführt, in dem die Anzahl der Vorkommen bestimmter Aussagen gezählt wurde, die für den RQ von Interesse waren (prognostizierte Zählvariable). Wir haben auch die maximale Anzahl möglicher Vorkommen (Codiereinheiten; Offset-Variable) aufgezeichnet. Darüber hinaus wurden mehrere Merkmale der Filme auf einer kontinuierlichen Skala gemessen, von denen wir für eines eine kausale Hypothese über die Auswirkung des Filmmerkmals auf die Anzahl der Aussagen haben, während die anderen Kontrolle (Prädiktoren) sind.
Die bisher angewandte Modellierungsstrategie lautet wie folgt:
Schätzen Sie ein Poisson-Modell mit zufälligen Effekten, bei dem die kausale Variable als Kovariate und die anderen Variablen als Kontrollkovariaten verwendet werden. Dieses Modell hat einen Versatz von 'log (units)' (Codiereinheiten). Zufällige Effekte werden fächerübergreifend aufgenommen (filmspezifische Zählungen sind in Fächer verschachtelt). Wir finden die Kausalhypothese bestätigt (Sig. Kausalkoeffizient). In R haben wir schätzungsweise das Paket lme4 verwendet, insbesondere die Funktion glmer.
Jetzt habe ich folgende Fragen. Ein häufiges Problem bei der Poisson-Regression ist die Überdispersion. Ich weiß, dass dies getestet werden kann, indem eine negative binomische Regression verwendet und bewertet wird, ob der Dispersionsparameter die Modellanpassung eines einfachen Poisson-Modells verbessert. Ich weiß jedoch nicht, wie ich das in einem zufälligen Effektkontext machen soll.
- Wie soll ich in meiner Situation auf Überdispersion testen? Ich habe die Überdispersion in einer einfachen binomischen Poisson- / Negativ-Regression (ohne zufällige Effekte) getestet, die ich anpassen kann. Der Test deutet auf eine Überdispersion hin. Da diese Modelle das Clustering jedoch nicht berücksichtigen, gehe ich davon aus, dass dieser Test falsch ist. Ich bin mir auch nicht sicher, welche Rolle der Offset bei Überdispersionstests spielt.
- Gibt es so etwas wie ein negatives binomiales Zufallseffekt-Regressionsmodell und wie soll ich es in R einpassen?
- Haben Sie Vorschläge für alternative Modelle, die ich anhand der Daten ausprobieren sollte, dh unter Berücksichtigung der Struktur der wiederholten Messungen, der Zählvariablen und der Exposition (Kodiereinheiten)?