Wann soll ein zufälliger Effekt in ein Modell aufgenommen werden?

Ich bin neu in der gemischten Modellierung und ich bin verwirrt, ob es angemessen ist, einen zufälligen Effekt in einer Analyse zu verwenden, die ich mache. Jeder Rat wäre dankbar.

Meine Studie testet, wie gut ein neu entwickelter Index der Säugetierhäufigkeit den Wert eines etablierten, aber arbeitsintensiveren Index vorhersagen kann. Ich habe diese Indizes in mehreren Waldflächen gemessen, mit mehreren Darstellungen in jedem Waldstück.

Da ich nicht direkt an der Wirkung von Waldflächen interessiert bin und meine Beispieldiagramme in Waldflächen verschachtelt sind, habe ich Waldflächen als zufälligen Effekt verwendet. Ich habe jedoch einige Fragen dazu:

Erstens weiß ich, dass zufällige Effekte es Ihnen ermöglichen, Ihre Ergebnisse auf alle möglichen Ebenen des Zufallsfaktors zu verallgemeinern, nicht nur auf die von Ihnen untersuchten. Aber es scheint mir, dass Ihre Level zufällig ausgewählt werden müssten, um diese Art von Schlussfolgerung zu ziehen. Meine Waldflächen wurden nicht zufällig ausgewählt. Kann ich sie trotzdem als zufälligen Effekt verwenden?

Zweitens habe ich gelesen, dass Sie testen können, ob ein zufälliger Effekt erforderlich ist, indem Sie beispielsweise einen Likelihood-Ratio-Test durchführen, um Modelle mit und ohne Effekt zu vergleichen. Ich habe dies getan und es deutet darauf hin, dass das Zufallseffektmodell die Daten nicht erklärt sowie ein Modell nur mit festen Effekten. Mein Problem dabei ist, dass meine Parzellen immer noch in Waldflächen verschachtelt sind und daher vermutlich nicht unabhängig sind. Kann ich diesen LRT-Ansatz verwenden, um das Ausschließen des zufälligen Effekts zu rechtfertigen, oder muss ich ihn trotzdem einbeziehen, um die Verschachtelung zu berücksichtigen? und wenn ich am Ende den zufälligen Effekt entferne, gibt es eine Möglichkeit zu überprüfen, ob Parzellen innerhalb von Waldflächen als unabhängig betrachtet werden können?

Danke für Ihre Hilfe!

Jay

random-effects-model nested-data

— Jay
quelle

Ich denke, die wichtigste konzeptionelle Sache bei zufälligen Effekten ist, dass sie alle ungefähr gleich groß und austauschbar sein sollten - dies macht den Rückschluss auf nicht abgetastete zufällige Effekte möglich. Sie sollten auch vorsichtig sein, wenn Sie LR-Tests für zufällige Effekte verwenden, da hinsichtlich der Varianzkomponente erhebliche Unsicherheiten bestehen können, selbst wenn die ML / REML-Schätzung Null oder nahe Null ist.

— Wahrscheinlichkeitslogik

Vielen Dank dafür. Gibt es also eine Möglichkeit, herauszufinden, ob es notwendig ist, den zufälligen Effekt beizubehalten?

— Jay

Soweit ich weiß, ist es am besten, keine LR-Vergleiche mit Modellen durchzuführen, die nach REML passen. In Rs lmer sollten Sie beispielsweise REML = FALSE setzen, wenn Sie LRT ausführen. (Es ist standardmäßig TRUE, was sonst besser ist.)

— Wayne

Soweit ich weiß, haben Sie ein einfaches verschachteltes Beobachtungsdesign (Diagramme innerhalb von Patches) und Ihr Interesse gilt einer Korrelation / Regression zwischen zwei kontinuierlichen Variablen (den beiden Indizes). Ihre Stichprobengröße beträgt m Patches xn Plots = N Beobachtungspaare (oder das entsprechende Summen, wenn es nicht ausgeglichen ist). Es war keine ordnungsgemäße Randomisierung beteiligt, aber vielleicht können / sollten / möchten Sie berücksichtigen, dass (1) die Patches "zufällig" aus allen Patches dieser Art oder in einem bestimmten Bereich ausgewählt wurden und (2) die Diagramme "zufällig" waren. innerhalb jedes Patches ausgewählt.

Wenn Sie das Zufallsfaktor-Patch ignorieren, können Sie pseudoreplizieren, indem Sie berücksichtigen, dass Sie N Diagramme "frei" zufällig ausgewählt haben, ohne sie auf (in Anzahl oder Typ) in diesen (zuvor) ausgewählten Patches zu beschränken.

Ihre erste Frage: Ja, das erlaubt ein Zufallsfaktor. Die Gültigkeit einer solchen Schlussfolgerung hängt von der Gültigkeit der Annahme ab, dass eine zufällige Auswahl einer zufälligen Auswahl von Patches entspricht (z. B. dass Ihre Ergebnisse nicht unterschiedlich wären, wenn ein anderer Satz von Wald-Patches ausgewählt würde). Dies schränkt auch Ihren Inferenzraum ein: Die Art des Waldes oder des geografischen Gebiets, bis zu dem sich Ihre Ergebnisse erstrecken, hängt von der maximalen (imaginären) Population von Patches ab, aus denen Ihre Stichprobe eine glaubwürdige "zufällige" Stichprobe ist. Vielleicht sind Ihre Beobachtungen eine "vernünftige Zufallsstichprobe" der Säugetiere der Waldflächen in Ihrer Region, aber eine verdächtig aggregierte Stichprobe der Säugetiere des gesamten Kontinents.

Der zweite: Der Test hängt vom "Grad der Pseudoreplikation" oder den Beweisen in Ihrer Stichprobe ab, dass Diagramme zu Patches "gehören". Dies ist, wie viel Variation zwischen Patches und Plots innerhalb von Patches besteht (Suche nach Intraclass-Korrelation). Im Extremfall ist nur eine Variation zwischen den Patches vorhanden (Diagramme innerhalb eines Patches sind alle gleich), und Sie haben eine "reine Pseudoreplikation": Ihr N sollte die Anzahl der Patches sein, und das Abtasten eines oder mehrerer Diagramme von jedem von ihnen bietet keine neue Informationen. Auf der anderen Seite treten alle Variationen zwischen den Parzellen auf, und es gibt keine zusätzliche Variation, die dadurch erklärt wird, dass man weiß, zu welchem Waldstück jede Parzelle gehört (und dann würde das Modell ohne den Zufallsfaktor sparsamer erscheinen). Sie haben "unabhängige" Handlungen. Keines der Extreme tritt sehr wahrscheinlich auf ... insbesondere bei biologischen Variablen, die am Boden beobachtet werden, schon allein aufgrund der räumlichen Autokorrelation und der geografischen Verteilung der Säugetiere. Ich persönlich bevorzuge es sowieso, Faktoren durch Design beizubehalten (z. B. selbst wenn Patches keine relevante Variationsquelle in dieser Probe sind), um die oben erläuterte "experimentell-beobachtende" Analogie aufrechtzuerhalten; Denken Sie daran: Wenn Sie in Ihrer Stichprobe keine Beweise dafür haben, dass die Null-Hipothese, dass die Variation zwischen den Patches Null ist, abgelehnt wird, bedeutet dies nicht, dass die Variation in der Population Null ist. selbst wenn Patches keine relevante Variationsquelle sind (IN DIESER BEISPIEL), um die oben erläuterte "experimentell-beobachtende" Analogie aufrechtzuerhalten; Denken Sie daran: Wenn Sie in Ihrer Stichprobe keine Beweise dafür haben, dass die Null-Hipothese, dass die Variation zwischen den Patches Null ist, abgelehnt wird, bedeutet dies nicht, dass die Variation in der Population Null ist. selbst wenn Patches keine relevante Variationsquelle sind (IN DIESER BEISPIEL), um die oben erläuterte "experimentell-beobachtende" Analogie aufrechtzuerhalten; Denken Sie daran: Wenn Sie in Ihrer Stichprobe keine Beweise dafür haben, dass die Null-Hipothese, dass die Variation zwischen den Patches Null ist, abgelehnt wird, bedeutet dies nicht, dass die Variation in der Population Null ist.

— FairMiles
quelle