Wann sind gemischte Modelle mit Nullkorrelation theoretisch sinnvoll?

Das folgende Blockzitat von Marktführern auf dem Gebiet der Modellierung gemischter Effekte besagt, dass Koordinatenverschiebungen in Modellen mit keiner Korrelation zwischen Zufallseffekten ('ZCP'-Modelle) die Modellvorhersagen ändern. Aber kann jemand seine Behauptungen näher erläutern oder weiter begründen?

Die Aussagen in Frage sind von Bates et al der 2015 Papier auf lme4, Montag Linear Mixed-Effects - Modelle Mit lme4 , Seite 7, Absatz ( Download - Link ). $\newcommand{\slope}{\text{slope}} \newcommand{\int}{\text{int}} \newcommand{\intercept}{\text{intercept}}$

Hier ist eine Umschreibung dessen, was sie geschrieben haben:

Obwohl Modelle mit Nullkorrelationsparametern verwendet werden, um die Komplexität von Zufallssteigungsmodellen zu verringern, weisen sie einen Nachteil auf. Modelle, in denen Steigungen und Abschnitte eine Korrelation ungleich Null aufweisen dürfen, sind gegenüber additiven Verschiebungen eines kontinuierlichen Prädiktors unveränderlich.

Diese Invarianz bricht zusammen, wenn die Korrelation auf Null beschränkt ist. Jede Verschiebung des Prädiktors führt zwangsläufig zu einer Änderung der geschätzten Korrelation sowie der Wahrscheinlichkeit und der Vorhersagen des Modells. ¹ Zum Beispiel können wir die Korrelation in fm1 beseitigen, indem wir einfach die Tage [den Prädiktor, der die begleitet ] um einen Betrag verschieben, der dem Verhältnis der geschätzten Standardabweichungen zwischen Probanden multipliziert mit der geschätzten Korrelation, dh ² , entspricht. $\slope$

$ρ_{slope : intercept} \times \frac{σ_{slope}}{σ_{intercept}}$ $\rho_{\slope:\intercept}\times\frac{\sigma_{\slope}}{\sigma_{\intercept}}$
Die Verwendung solcher Modelle sollte idealerweise auf Fälle beschränkt werden, in denen der Prädiktor auf einer Verhältnisskala gemessen wird (dh, der Nullpunkt auf der Skala ist sinnvoll und nicht nur ein durch Zweckmäßigkeit oder Konvention definierter Ort).

Fragen:

Nummeriert in Übereinstimmung mit den obigen Hochstellungen ...

Ich kann sehen, dass jede Verschiebung des Koordinatensystems, an dem der Prädiktor gemessen wird, zu einer Änderung der geschätzten Korrelation führt, was zu einer Korrelation ungleich Null führt. Dies stützt die Aussage, dass Nullkorrelations-Parametermodelle bei Verschiebungen in Prädiktorkoordinatensystemen nicht invariant sind und daher jedes Modell mit Korrelationen mit zufälligen Effekten ungleich Null durch eine geeignete Verschiebung der Koordinaten in ein Modell mit Nullkorrelationen umgewandelt werden kann. Ich denke, es unterstützt auch den dritten Absatz in der obigen Paraphrasierung: ZCP-Modelle (und Zero-Intercept-Modelle - siehe unten; bitte überprüfen Sie dies ) sind nur für Modelle gültig, die bestimmte, spezielle Koordinatensysteme verwenden. Aber warum sollte eine Koordinatenverschiebung die Vorhersagen für solche Modelle ändern?

Beispielsweise ändert eine Verschiebung der Koordinaten auch den Intercept-Term mit festem Effekt für Gruppenmittelwerte (siehe unten), jedoch nur um einen Betrag, der der Änderung des Ursprungs für das Koordinatensystem des Prädiktors entspricht. Eine solche Änderung wirkt sich nicht auf Modellvorhersagen aus, solange das neue Koordinatensystem für den verschobenen Prädiktor verwendet wird.

Wenn die Steigung mit festem Effekt, die dem verschobenen Prädiktor zugeordnet ist, positiv ist und der Ursprung für das Koordinatensystem des Prädiktors in die negative Richtung verschoben ist, verringert sich der Schnittpunkt mit festem Effekt und alle zugehörigen zufälligen Effektabschnitte ändern sich ebenfalls dementsprechend spiegelt sich die neue Definition des „Ursprungs“ (und damit des Abschnitts) im verschobenen Koordinatensystem wider. Ich denke übrigens, diese Argumentation impliziert auch, dass ein Null-Intercept-Modell unter solchen Verschiebungen auch nicht invariant ist.

Ich denke, ich habe eine vernünftige Methode, um das herauszufinden, aber eine etwas andere Antwort als Bates et al. Gehe ich irgendwo falsch

Unten ist meine Antwort. Im Folgenden wird beschrieben, wie ich zu meinem Ergebnis gekommen bin. Zusammenfassend stelle ich fest, dass, wenn ich den Ursprung negativ um , so dass der Prädiktor im neuen Koordinatensystem die Werte annimmt , dann die Korrelation im neuen Koordinatensystem ist Null, wenn: $x$ $\delta > 0$ $x' = x + \delta$ $\rho'$

$δ = ρ_{slope : intercept} \times \frac{σ_{intercept}}{σ_{slope}}$ $\delta=\rho_{\slope:\intercept}\times\frac{\sigma_{\intercept}}{\sigma_{\slope}}$
Dies unterscheidet sich vom Ergebnis von Bates et al .

Beschreibung meiner Methode (optionales Lesen) : Nehmen wir an, wir haben die Korrelation von zwei zufälligen Effekten, und (kurz ), die beide demselben Gruppierungsfaktor mit Ebenen entsprechen (mit nummeriert , im Bereich von zu ). Nehmen wir auch an, dass der stetige Prädiktor, mit dem der Zufall gepaart wird, heißt und so definiert ist, dass das Produkt den bedingten Beitrag zum angepassten Wert für Stufe $\slope$ $\intercept$ $\int$ $k$ $i$ $1$ $k$ $\slope$ $x$ $x\times\slope_i$ $\hat y_{obs}$ $i$ des zugehörigen Gruppierungsfaktors. Obwohl in der Realität der MLE-Algorithmus den Wert von , um die Wahrscheinlichkeit zu maximieren , würde ich erwarten, dass der folgende Ausdruck eine dimensionsrichtige Methode zur Bestimmung der Auswirkungen einer einheitlichen Translation in , dem Multiplikator des Zufallseffekts für . $\rho$ $x$ $\slope$

ρ_{slope : int} = \frac{E_{i} [({slope}_{i} - \bar{{slope}_{i}}) ({int}_{i} - \bar{{int}_{i}})]}{\sqrt{E_{i} [({slope}_{i} - \bar{{slope}_{i}})^{2}] E_{i} [({int}_{i} - \bar{{int}_{i}})^{2}]}}

$\rho_{\slope:\int} = \frac{E_{i}\big[(\slope_i -\overline {\slope_i})(\int_i -\overline {\int_i})\big]}{\sqrt{E_{i}\big[(\slope_i -\overline {\slope_i})^2\big]E_{i}\big[(\int_i-\overline {\int_i})^2\big]}}$

Um zu meinem Ergebnis zu kommen, habe ich zuerst den alten Wert für den Achsenabschnitt in Form eines neuen Werts für den Achsenabschnitt umgeschrieben: (hier , die' nach links 'Ursprungsverschiebung für Prädiktor ). Dann habe ich den resultierenden Ausdruck in den Zähler der obigen Formel für und den Wert von berechnet, der im neuen Koordinatensystem zu einer Kovarianz von Null führte. Beachten Sie, dass sich, wie in Frage 1 oben angegeben, auch der festem Effekt auf analoge Weise ändert: . (Hier $\int' = -\delta \times \slope + \int$ $\delta > 0$ $x$ $\rho$ $\delta$ $\beta_0' =- \delta\times\beta_x + \beta_0$ $\beta_x$ ist der Prädiktor mit festem Effekt, der dem verschobenen Prädiktor) $x.$

r mixed-model lme4-nlme

— Clarpaul
quelle

Ein paar grobe Ideen. ändert sich, wenn (1) sich die feste Steigung ändert oder (2) sich die zufälligen Steigungen ändern. Zu (1): Die feste Steigung kann als gewichtetes Mittel der clusterspezifischen Steigungen betrachtet werden, wobei das Gewicht teilweise von den geschätzten Varianzkomponenten abhängt. Das Weglassen der Kovarianz verändert die Var. Schätzungen, Ändern der Gewichte, Ändern der festen Neigung. Zu (2): Die zufälligen Steigungen sind die clusterspezifischen Steigungen, die proportional zu den gleichen Gewichten in Richtung der festen Steigung "geschrumpft" sind. Das Weglassen der Kovarianz verändert die Var. Schätzungen, Ändern des Schrumpfungsgrads, Ändern der zufälligen Steigungen.

\hat{y}

$\hat{y}$

— Jake Westfall

Ich bin ein wenig enttäuscht, dass dies nicht mehr Aufmerksamkeit erregt hat, @clarpaul. Sie könnten einfach Ihre eigene Antwort eingeben. Wenn niemand anderes antwortet, gebe ich Ihnen einfach die Prämie.

— gung - Reinstate Monica

Danke @gung, meine Antwort würde eng mit meinen "Bearbeitungen" oben übereinstimmen. Das Kopfgeld wäre schön, aber ich habe möglicherweise keine Zeit, bevor es abläuft. Ich ermutige jeden, meine "Änderungen" zu übernehmen und sie in eine Antwort umzuwandeln, wenn er mit den grundlegenden Überlegungen einverstanden ist und bereit ist, sich die Zeit zu nehmen, um sie ein wenig zu verbessern.

— Clarpaul

Die Antwort auf diese Frage stellt sich heraus , eher sein definitorischen . Wenn man die Koordinaten der unabhängigen Variablen eines ZCP Modell und verschoben erlaubt Korrelationen in einer ungezwungenen Art und Weise zu entwickeln , würde die Prognosen nicht ändern, weil lineare gemischte Effekte Modelle mit unbeschränkten Korrelationen sind translationsinvariantes (man kann dies zeigen , mit ein wenig Mathematik) . Aber durch Definition , ein ZCP Modell hat Korrelationen eingeschränkt . Bei Koordinatenverschiebungen könnten sich Korrelationen in einem nicht eingeschränkten LME-Modell nicht wie erforderlich entwickeln. Daher sind ZCP-Modelle nicht translationsinvariant, und eine Koordinatenverschiebung würde dies bewirken $0$ Modellvorhersagen ändern. Und (wenn Sie davon ausgehen, dass LME-Modelle translationsunabhängig von sensiblen Koordinatenverschiebungen sind) , sind theoretisch nur Modelle sinnvoll, bei denen solche Koordinatenverschiebungen nicht sinnvoll sind, wie ZCP-Modelle (dh die im dritten Absatz der Paraphrase genannten „speziellen“ Modelle) von Bates et al. oben). [Hinweis: Ich werde diese Antwort in Zukunft mit Formeln ausstatten, die ich für die Korrelation abgeleitet habe, die sich bei der Koordinatenverschiebung eines anfänglichen ZCP-Modells entwickelt, und für den Beweis, dass LME-Modelle mit nicht eingeschränkten Korrelationen translationsinvariant sind.]
Das Ergebnis von Bates et al . Ist einfach ein Tippfehler. Die Antwort muss dieselbe Dimension haben wie der verschobene Prädiktor ( Tage ). Da wlog, und als Dimensionen der Einheit angesehen werden können, muss , die die Dimensionen (dieselben Dimensionen wie die ) hat, im Nenner sein, damit , um die richtigen Abmessungen zu haben. $\delta$ $x$ $\sigma_{intercept}$ $\rho$ $\sigma_{slope}$ $1/x$ $slope$ $\delta$

— Clarpaul
quelle