Habe ich mein Modell in lmer korrekt angegeben?


26

Ich habe viele Hilfeseiten durchsucht und bin immer noch verwirrt darüber, wie kompliziertere verschachtelte Begriffe auch in einem gemischten Modell angegeben werden können. Ich bin auch verwirrt über die Verwendung von :und /und die |Angabe von Wechselwirkungen und Verschachtelungen mit Zufallsfaktoren, die lmer()im lme4Paket in verwendet werden R.

Für diese Frage nehmen wir an, dass ich meine Daten mit diesem statistischen Standardmodell korrekt dargestellt habe: ist festgelegt, und sind zufällig. ist (implizit) verschachtelt in .

Yijk=u+stationi+towj(i)+dayk+(station×day)ik+(tow×day)j(i)k
stationtowdayTowstation

Mit anderen Worten, ich hoffe, dass mein Modell Station (i, fest), Tow (j, zufällig, implizit in Station verschachtelt), Tag (k, zufällig) und die Interaktion zwischen Tow und Tag sowie die Interaktion zwischen Tag umfasst und Station. Ich habe mich an einen Statistiker gewandt, um mein Modell zu erstellen, und bin zu diesem Zeitpunkt der Ansicht, dass es für meine Daten repräsentativ ist, werde aber auch eine Beschreibung meiner Daten für diejenigen hinzufügen, die am Ende meines Beitrags interessiert sind, um keine Unordnung zu verursachen.

Bisher konnte ich Folgendes zusammenfügen lmer:

lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day), 
     data=my.data)

Stellt dies mein statistisches Modell genau dar? Irgendwelche Vorschläge, wie ich meinen Code verbessern kann, wenn er nicht richtig gelesen wird?

Ich habe die spezifischen Begriffe, die ich in meiner früheren Formel nur schwer angeben kann, fett gedruckt

# 1. Schlepptau innerhalb Station verschachtelt , wenn Schlepptau zufällig und Station befestigt ist
, ich bin verwirrt, aber etwa zwischen verschachtelten und Interaktionsbedingungen Differenzierung , die zufällig sind mit :und /. In meinem obigen Beispiel habe ich, (1|station:tow)in dem ich hoffe , dass es in der Station verschachtelt ist. Ich habe widersprüchliche Kommentare auf verschiedenen Seiten gelesen, ob ich :oder /hier im zufälligen (1|...)Format verwenden soll lmer.

# 2. Die Interaktion zwischen Station und Tag, wenn Station und Tag festgelegt sind, ist zufällig
, (1|station:day)aber diesmal hoffe ich, dass sie die Interaktion zwischen Station und Tag liest. Es sieht so aus, als könnte ich station * day verwenden, um die individuellen Auswirkungen von station und day sowie deren Interaktion zu berücksichtigen (anstatt jeden der drei Begriffe wie oben beschrieben separat einzubeziehen), aber ich verstehe nicht, wie ich das spezifizieren soll wenn einer feststeht und der andere zufällig ist. Würde das station*(1|day)machen?

#3. Die Interaktion zwischen Schlepptau und Tag (beide zufällig), an dem Schlepptau in Station verschachtelt ist (feststehend) Als letztes habe (1|tow:day)ich, wie ich hoffe, die Interaktion von towund gelesen day, aber ich frage mich, ob ich erneut angeben muss, dass Schlepptau verschachtelt ist (implizit) im Bahnhof?

Ich bin sowohl Rmit der lmerstatistischen Modellierung als auch mit der statistischen Modellierung neu und schätze die Mühe gründlicher Erklärungen bei der Beantwortung meiner Fragen, wenn möglich, sehr.

Weitere Details zu meinen Daten: Ich frage, ob sich die Planktonkonzentrationen an einer physischen Front im küstennahen Ozean unterscheiden. Ich habe drei Stationen an Land, innerhalb und vor der Küste dieser Front. Station ist damit fixiert. An jeder Station nehme ich drei Replikat-Plankton-Kabel (von denen ich sortiere, zähle und eine Konzentration in Bezug auf die Anzahl der Insekten pro Kubikmeter Wasser erhalte). Schlepptau ist zufällig: Ich hoffe, in drei Schlepptauen die allgemeine Variabilität des Planktons an dieser bestimmten Station erklären zu können. Tow ist eigenständig in der Station verschachtelt, da jedes Tow keine eindeutige ID hat (123.123.123 ist die ID für Tows an jeder Station). Ich tat dies dann an mehreren unabhängigen Tagen mit einer neuen Front, die sich gebildet hatte. Ich denke, ich kann mir den Tag als blockierenden Faktor vorstellen? Der Tag ist zufällig, da das Wiederholen dieses Vorgangs an mehreren unabhängigen Fronttagen versucht, die Variabilität von Tag zu Tag zu erfassen und für alle Tage repräsentativ zu sein, an denen diese Front vorhanden ist. Ich möchte über die Interaktionsbedingungen informiert werden, um zu sehen, ob sich die Schwankungsbreite von Tag zu Tag ändert und ob Stationen immer ähnliche Daten liefern oder ob dies vom Tag abhängt.

Nochmals vielen Dank für Ihre Zeit und Hilfe, ich weiß es zu schätzen!


Ich glaube, Sie vermissen einige Indizes (ich wollte sie nicht hinzufügen, wenn ich mich geirrt habe) in Ihrem statistischen Standardmodell.

1
FWIW, für alle, die auf diesen Thread stoßen und sich fragen, ob er zum Thema gehört, ist er angesichts seines Schwerpunkts auf RSyntax und IMO ausreichend statistisch (um zu verstehen, wie sich das angegebene Modell auf Verschachtelung und Interaktionen usw. bezieht), um zum Thema zu gehören für Lebenslauf.
gung - Wiedereinsetzung von Monica

1
Dies ist meiner Meinung nach 100% thematisch.


2
Entsprechend Ihrer lmer()Syntax haben Sie ein Modell angegeben, bei dem es einen festen Effekt von stationund vier zufällige Abschnitte gibt, die von Personen mit derselben (1) Kombination von stationund tow, (2) Wert von Day, (3) Kombination von stationund dayund ( 4) Kombination von towund day, respectively. Ist es das, was du beabsichtigt hast? Ich bin mir nicht sicher, da, wie von @BabekP angegeben, nicht klar ist, wie Sie Ihre Modellformulierung geschrieben haben. Sie haben Variablennamen und keine Parameter geschrieben. Normalerweise werden in einem Modell wie diesem die Variablenkombinationen von den Indizes erfasst.
Makro

Antworten:


23

Schlepptau in Station verschachtelt, wenn Schlepptau zufällig ist und die Station feststeht

station+(1|station:tow)ist richtig. Wie @John in seiner Antwort sagte, (1|station/tow)würde sich erweitern auf (1|station)+(1|station:tow)(Haupteffekt der Station plus Interaktion zwischen Schlepptau und Station), was Sie nicht wollen, weil Sie die Station bereits als festen Effekt angegeben haben.

Interaktion zwischen Station und Tag, wenn die Station fest und der Tag zufällig ist.

Die Wechselwirkung zwischen einem festen und einem zufälligen Effekt ist immer zufällig. Wieder wie @John sagte, station*dayerweitert sich zu station+day+station:day, was Sie (wieder) nicht wollen, weil Sie bereits dayin Ihrem Modell angegeben haben. Ich glaube nicht, dass es eine Möglichkeit gibt, das zu tun, was Sie wollen, und die gekreuzten Effekte von day(zufällig) und station(behoben) zu reduzieren, aber Sie könnten schreiben station+(1|day/station), wenn Sie möchten, was sich wie in der vorherigen Antwort angegeben erweitern würde station + (1|day) + (1|day:station).

Interaktion zwischen dem Schlepptau und dem Tag, an dem das Schlepptau in der Station verschachtelt ist

Weil Sie nicht eindeutige Werte der haben keine towVariable (dh weil , wie Sie sagen , unten schleppt angegeben werden als 1, 2, 3an jeder Station, Sie tun müssen , die Verschachtelung zu spezifizieren, wie (1|station:tow:day). Wenn Sie die Kabel eindeutig angegeben hatte, konnte man entweder (1|tow:day)oder (1|station:tow:day)(Sie sollten gleichwertige Antworten geben.) Wenn Sie in diesem Fall die Verschachtelung nicht angeben, lme4versuchen Sie, einen zufälligen Effekt abzuschätzen, der von Schlepptau Nr. 1 an allen Stationen geteilt wird.

station:tow:day××

Sind http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#model-specification und http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#nested-or-crossed für Sie nützlich?


Vielen Dank für die hilfreiche Antwort und Hinweise, sie werden sehr geschätzt. Ich bin verwirrt über die oben beschriebene Notation (1 | a: b), in der das ':' sowohl "verschachtelt" als auch eine Interaktion bedeuten kann. Wie kann es beides spezifizieren? Mit anderen Worten, woher weiß ich, auf welche Beziehung Sie hinweisen? Ich muss hier etwas Grundlegendes vermissen, ich entschuldige mich.
24.

4
In diesem Zusammenhang besteht kein so großer Unterschied zwischen Interaktion und Verschachtelung. Ob Bes verschachtelt ist Aoder nur damit interagiert, hängt davon ab, ob der Haupteffekt von Aim Modell enthalten ist oder nicht. Wenn der Haupteffekt Bist auch in dem Modell dann ist es überquert ...
Ben Bolker

Hallo zusammen, ich habe hier eine verwandte Frage gestellt: stats.stackexchange.com/questions/272377/… wenn jemand (insbesondere @BenBolker) die Möglichkeit hat, nachzuschauen und eine Antwort zu geben.
Joshua Rosenberg

11

Einige der Dinge in der Formel sind etwas verwirrend. Das :ist für Interaktionen zwischen zwei Begriffen, während das *für Haupteffekte und Interaktionen ist. Das /ist ein anderes für Interaktionen, aber es erzeugt eine Interaktion zwischen dem Zähler und allen Begriffen im Nenner (z A/(B+C) = A:B + A:C. B. ). Das |ist für so etwas wie "gruppiert nach". So 1|stationwürde Intercept von Station gruppiert und in Klammern ist es zufällig (1|station). So würdest du nisten.

Hoffentlich ist das eine Hilfe. Es ist etwas seltsam, einen zufälligen Effekt in einem festen Effekt zu haben, und ich bin mir nicht sicher, wie Sie das darstellen würden. Ich kann mir die Situation gar nicht vorstellen. Sie erhalten möglicherweise eine bessere Antwort, wenn Sie nur erläutern, was Ihre Variablen sind und was Sie erreichen möchten. Oft stellen Leute Fragen und verwenden die Terminologie falsch und es ist schwierig zu kommunizieren. Erklären Sie, was die Variablen darstellen und was Sie darüber wissen möchten.

Wenn Sie sich in Ihrem letzten Absatz auf Ihre Beschreibung konzentrieren, scheint Ihr Kabel lediglich ein Indikator für die von Ihnen gesammelten Stichproben zu sein, und Sie brauchen keine Schätzungen in dem Sinne, dass Sie erwarten, dass sich Kabel 1 in irgendeiner Weise konsequent von Kabel 2 unterscheidet. Tow zeigt nur eine Probe an. Wenn Sie nicht wirklich glauben, dass die Reihenfolge der Schlepptau wichtig ist, kümmern Sie sich nicht einmal um diese Variable. Und wenn es darauf ankam, dann war es ein fester Effekt (und vielleicht ein zufälliger, aber kein rein zufälliger Effekt). Sie sagen, Sie möchten wissen, ob sich die Variabilität der Schleppseile von Tag zu Tag ändert. Wie wäre es mit der Antwort ja? Es ist nicht realistisch, dass sie sich von Tag zu Tag ändern. Es ist nur die Varianz Ihrer Maße. Du' Es ist nicht erlaubt, zu versuchen, jede Varianzspezifikation zu berücksichtigen, da dann keine Varianz mehr für einen Fehler übrig bleibt. Sie hätten ein überbestimmtes Modell. Sie wären gerade dabei, jede Maßnahme zu melden.

Sie machen eine ähnliche Aussage über die Frage, ob die Station von Tag zu Tag variiert. natürlich tut es das. Aber vielleicht meinst du bestimmte Tage? Waren die Tage in irgendeiner Weise nach Jahreszeit, Mondzyklus usw. gruppiert? Wenn Sie nicht nur Tag 1, sondern auch Tag 2 haben, wie können Sie dann feststellen, dass die Stationen von Tag zu Tag anders sind als die Stationen? Die Antwort auf diese Frage ist natürlich, dass die Stationen von Tag zu Tag variieren. Und natürlich variieren die Schlepptau- che von Tag zu Tag und von Station zu Station. Am Ende haben Sie ein einfaches Modell:

aov(y ~ station, data = dat)

Der einzige feste Effekt, den Sie hier haben, Station, wird nur über mehrere Schlepptau- che und mehrere Tage hinweg abgetastet. Ich bin mir nicht sicher, ob Sie hier überhaupt eine mehrstufige Modellierung benötigen. Es hört sich so an, als würden Sie Ihr Modell zu sehr spezifizieren.

Wenn Sie wirklich zufällige Tag- und Abschleppeffekte wünschen und Informationen haben, die Sie hier nicht angegeben haben, können Sie sie zu einem mehrstufigen Modell erweitern. Das wäre:

lmer(y ~ station + (two*day|station), data = dat)

Sie benötigen jedoch mehrere Schleppseile an jeder Station und an jedem Tag, um dieses Modell zu verwenden.


Ich bin mit allem einverstanden, was Sie gesagt haben, aber ich denke, das ist wahrscheinlich eher ein Kommentar als eine Antwort.
Makro

@John Ich war bei dir, bis "so würdest du nisten". Ich glaube, ich habe den eigentlichen Punkt, wie Sie nisten, verpasst. Wären Sie bereit, dies näher zu erläutern? Ich glaube, ich bin immer noch verwirrt von und werde mehr darauf schauen. Aus Ihrer Antwort geht jedoch hervor, dass ich immer noch nicht sicher bin, wie ich zum Beispiel angeben soll, dass der Schlepptau (zufällig) in der Station (fest) verschachtelt ist.
Wtree

@John Oh und Station ist festgelegt, da Orte / Orte von Interesse im Ozean und Schlepptau zufällig sind, da ich Planktonschlepptau an diesen Orten nehme, die zufällig sind, da sie versuchen, die Variabilität des Planktons an jedem Ort zu berücksichtigen und dann extrapoliert zu werden um die Planktonpopulation an einer Station darzustellen.
Wtree

1
Nicht jedes Etikett eines Samples ist eine Zufallsvariable, siehe Änderungen.
John

1
Ich denke immer noch, dass Schlepptau bei dieser Beschreibung überhaupt nicht im Modell sein sollte. Der Tag klingt aber gut.
John
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.