Ich habe Langzeitsammeldaten und möchte testen, ob die Anzahl der gesammelten Tiere von Wettereffekten beeinflusst wird. Mein Modell sieht wie folgt aus:
glmer(SumOfCatch ~ I(pc.act.1^2) +I(pc.act.2^2) + I(pc.may.1^2) + I(pc.may.2^2) +
SampSize + as.factor(samp.prog) + (1|year/month),
control=glmerControl(optimizer="bobyqa", optCtrl=list(maxfun=1e9,npt=5)),
family="poisson", data=a2)
Erklärung der verwendeten Variablen:
- SumOfCatch: Anzahl der gesammelten Tiere
- pc.act.1, pc.act.2: Achsen einer Hauptkomponente, die die Wetterbedingungen während der Probenahme darstellen
- pc.may.1, pc.may.2: Achsen eines PCs, die die Wetterbedingungen im Mai darstellen
- SampSize: Anzahl der Fallstricke oder Sammeln von Durchschnitten mit Standardlängen
- samp.prog: Probenahmemethode
- Jahr: Jahr der Probenahme (von 1993 bis 2002)
- Monat: Monat der Probenahme (von August bis November)
Die Residuen des angepassten Modells zeigen eine erhebliche Inhomogenität (Heteroskedastizität?), Wenn sie gegen angepasste Werte aufgetragen werden (siehe Abb. 1):
Meine Hauptfrage lautet: Ist dies ein Problem, das die Zuverlässigkeit meines Modells in Frage stellt? Wenn ja, was kann ich tun, um das Problem zu beheben?
Bisher habe ich Folgendes ausprobiert:
- Kontrolle der Überdispersion durch Definieren zufälliger Effekte auf Beobachtungsebene, dh Verwenden einer eindeutigen ID für jede Beobachtung und Anwenden dieser ID-Variablen als zufälliger Effekt; Obwohl meine Daten eine erhebliche Überdispersion zeigen, half dies nicht, da die Residuen noch hässlicher wurden (siehe Abb. 2).
- Ich habe Modelle ohne zufällige Effekte mit Quasi-Poisson glm und glm.nb angepasst. ergab auch ähnliche Residuen gegenüber angepassten Parzellen wie das ursprüngliche Modell
Soweit ich weiß, gibt es möglicherweise Möglichkeiten zur Schätzung heteroskedastisch konsistenter Standardfehler, aber ich habe keine solche Methode für Poisson (oder eine andere Art von) GLMM in R gefunden.
Als Antwort auf @FlorianHartig: Die Anzahl der Beobachtungen in meinem Datensatz beträgt N = 554, ich denke, das ist eine faire Beobachtung. Nummer für ein solches Modell, aber je mehr desto besser. Ich poste zwei Figuren, von denen die erste die DHARMa-skalierte Restkurve (von Florian vorgeschlagen) des Hauptmodells ist.
Die zweite Figur stammt aus einem zweiten Modell, bei dem der einzige Unterschied darin besteht, dass es den zufälligen Effekt auf Beobachtungsebene enthält (die erste nicht).
AKTUALISIEREN
Abbildung der Beziehung zwischen einer Wettervariablen (als Prädiktor, dh x-Achse) und dem Stichprobenerfolg (Antwort):
UPDATE II.
Zahlen, die Prädiktorwerte gegenüber Residuen zeigen: