Die mathematische Darstellung eines verschachtelten Zufallseffektterms

Angenommen, eine abhängige Ebenenvariable wird auf einer Einheitenebene (Ebene 1) gemessen, die in Einheiten des Typs (Ebene ) verschachtelt ist , und Einheiten des Typs sind in Ebenen des Typs (Ebene ) verschachtelt . $y$ $A$ $2$ $A$ $B$ $3$

Angenommen, ich passe die folgende Formel an:

y ~ "FIXED EFFECTS [my syntax]" + (1 + x | B/A)

Dabei ist ein Prädiktor auf Ebene . $x$ $1$

Mein Verständnis ist, dass die mathematische Darstellung einer solchen Formel die folgende ist. Ist es richtig?

In dem, was folgt, ist der Ausgang des - ten Datenpunktes in Einheit von in Einheit verschachtelt von . Dieser Datenpunkt hat einen entsprechenden Prädiktor . $y_{b,a,i}$ $i$ $a$ $A$ $b$ $B$ $x_{b,a,i}$

y_{b, a, i} = “fixed effects'' + u_{b} + u_{b, 1, a} + (β_{b} + β_{b, 1, a}) x

$y_{b,a,i} = \text{“fixed effects''} + u_b + u_{b,1,a} + (\beta_b + \beta_{b,1,a})x$

u_{b} \sim N (0, σ_{B})

$u_b \sim N(0, \sigma_B)$

u_{b, 1, a} \sim N (0, σ)

$u_{b,1,a} \sim N(0, \sigma)$

β_{b} \sim N (0, ρ_{B})

$\beta_b \sim N(0, \rho_B)$

β_{b, a} \sim N (0, ρ)

$\beta_{b,a} \sim N(0, \rho)$

Das heißt, ist ein Standardabweichungsterm, der über Ebene variiert . Auf der anderen Seite, jeden gegebenen , eine Einheit in Ebene , und eine Einheit enthielt in Ebene , dann ist die Standardabweichung Begriff für ist . Das heißt, ist für jede Stufe konstant $\sigma_B$ $3$ $b$ $3$ $a$ $2$ $a$ $\sigma$ $\sigma$ $2$ Einheiten der .

Ist das richtig (ich habe diese Argumentation anhand einer ähnlichen Präsentation auf Seite 136 von Linear Mixed Models: Ein praktischer Leitfaden mit statistischer Software abgeleitet)? Wenn dies korrekt ist, gibt es eine Möglichkeit, dies zu tun $\sigma$ abhängig sein von welcher Ebene Einheit $A$ Der Datenpunkt gehört zu.

r lme4-nlme random-effects-model

— Muno
quelle

Ich denke, Sie vermissen einen zufälligen Effekt in Ihrer Formel. Antwort $y_{iab}$ hängt von den festen Effekten + einem Fehlerterm mit 5 Komponenten ab.

ε_{i a b} + ε_{a | b} + ε_{b} + x β_{a ∣ b} + x β_{b}

$\varepsilon_{iab} + \varepsilon_{a|b} + \varepsilon_{b} + x\beta_{a\mid b} + x\beta_b$

In der Reihenfolge von links nach rechts haben diese Komponenten die folgenden Interpretationen:

Der reine Fehler (persönlich für jede Beobachtung)
Variation aufgrund unterschiedlicher A-Niveaus innerhalb eines gemeinsamen B-Niveaus
Variation aufgrund unterschiedlicher Niveaus von B.
Wie A die Steigung des beeinflusst $x$ Beziehung gegeben gemeinsame Ebene B.
Wie Level B die Steigung von beeinflusst $x$

Das kannst du nicht zulassen $\sigma$ mit der Stufe von A variieren, da das Modell nicht mehr identifizierbar wäre (zu viele Parameter, die alle den gleichen Job ausführen). Sofern die Abweichung nicht von bekannten Gewichten abhängt (z. B. Gruppenzahlen), haben Sie in diesem Fall immer noch die gleiche Anzahl von Parametern. Denken Sie daran, dass wir die Werte der Ebenen von A (oder B) nicht kennen, sie jedoch unter der Annahme einer festen Varianz schätzen. Wir müssen hier eine Art Regelmäßigkeit annehmen.

Edit: @Amoeba stellt dies in Frage und ich habe mich möglicherweise über die Möglichkeit unterschiedlicher Werte der Varianz der Beobachtungen geirrt. Eigentlich habe ich die Frage des OP falsch verstanden. Ich dachte an die Varianz der $\alpha$ versteckte Effekte und nicht der reine Fehler der einzelnen Beobachtungen. Da die A- und B-Werte vermutlich zufällig sind, sollten die Varianzen auch als zufällige Effekte betrachtet werden, was bedeutet, dass bei ihrer Schätzung eine Art Regularisierung angewendet werden sollte, wie dies bei den zufälligen Effekten der A- und B-Werte selbst der Fall ist.

Es wird schlimmer. Der Wert des Modells mit gemischten Effekten besteht darin, dass Sie Konfidenzintervalle für nicht getestete Situationen bilden können (Ebenen A und B nicht im Modell enthalten). Sie müssten also definitiv eine Verteilung auf die Varianzen erstellen und Ihre Konfidenzintervalle entsprechend anpassen . Es klingt ziemlich hässlich.

Und sicher werden Sie eine Menge Daten benötigen, damit dies gut funktioniert, da wir über das Schätzen von Abweichungen und Mitteln sprechen.

Was den Welch-Test betrifft, so handelt es sich im Grunde genommen um einen Kludge, der auf das sogenannte Behrens-Fisher-Problem angewendet wird - das Problem, die Differenz zweier Mittelwerte zu testen, wenn die Varianzen ungleich sind. Wenn Speicher zur Verfügung steht, besteht das Problem darin, dass Sie keine ausreichende Statistik mit fester Dimension für diese haben.

Für mich ist die Frage, warum dieses Problem überhaupt eine sinnvolle Lösung zulassen sollte. Was bedeutet es eigentlich, Mittelwerte zu vergleichen, wenn die Varianzen ungleich sind? Stellen Sie sich zwei Automodelle vor. Autos des Modells A haben normalerweise eine begrenzte und vorhersehbare Anzahl von Reparaturen pro Jahr. Autos vom Modell B sind manchmal Zitronen und manchmal hervorragend. Was bedeutet es in diesem Fall, die durchschnittlichen Betriebskosten zu vergleichen? Aber das ist es, worüber wir sprechen, wenn sich die Abweichungen der Ebenen ändern dürfen. Wie viel Sinn macht es wirklich, Mittelwerte zu vergleichen, wenn die Abweichungen variieren dürfen? Es deutet darauf hin, dass Sie Äpfel und Orangen vergleichen.

Referenz. Da Sie anscheinend R dafür verwenden, möchten Sie vielleicht Bates und Pinheiros Buch Mixed Effects Models in S-plus lesen , da sie den Code für Rs nlme- und lme4-Pakete geschrieben haben. Dieses Buch enthält alle Details, die Sie möglicherweise benötigen könnten. Sie ermöglichen Korrelationen zwischen den Beobachtungen mit einer gemeinsamen Ebene.

— Placidia
quelle

Warum ist das Modell nicht identifizierbar, wenn die Varianz mit der Gruppierungsvariablen variieren darf? Ist es nicht wie ein Welch-T-Test (dass man mit einigen Hacks sogar in lme4 codieren kann, siehe stats.stackexchange.com/a/144480/28666 )?

— Amöbe

@ Amöbe Danke. Du hast Recht. Ich habe die Frage falsch verstanden und dachte, sie beziehe sich auf eine andere Varianz für jede Ebene der

α

$\alpha$ Verteilung.

— Placidia