Hallo, ich habe zwei Probleme, die wie natürliche Kandidaten für mehrstufige / gemischte Modelle klingen, die ich nie benutzt habe. Die einfachere Variante, die ich als Einführung versuchen möchte, sieht wie folgt aus: Die Daten sehen aus wie viele Zeilen des Formulars
x y innergroup outergroup
wobei x eine numerische Kovariate ist, auf die ich y zurückführen möchte (eine andere numerische Variable), jedes y zu einer inneren Gruppe gehört und jede innere Gruppe in einer äußeren Gruppe verschachtelt ist (dh alle y in einer gegebenen inneren Gruppe gehören zu derselben äußeren Gruppe) . Leider hat die innere Gruppe viele Ebenen (viele Tausend) und jede Ebene hat relativ wenige Beobachtungen von y, so dass ich dachte, dass diese Art von Modell angemessen sein könnte. Meine Fragen sind
Wie schreibe ich eine solche mehrstufige Formel?
Sobald lmer passt das Modell, wie geht man etwa davon die Vorhersage? Ich habe einige einfachere Spielzeugbeispiele angepasst, aber keine predict () - Funktion gefunden. Die meisten Menschen scheinen mehr an Schlussfolgerungen als an Vorhersagen mit dieser Art von Technik interessiert zu sein. Ich habe mehrere Millionen Zeilen, daher sind die Berechnungen möglicherweise ein Problem, aber ich kann sie jederzeit entsprechend reduzieren.
Ich brauche die Sekunde für einige Zeit nicht zu machen, aber ich könnte genauso gut anfangen, darüber nachzudenken und damit herumzuspielen. Ich habe ähnliche Daten wie zuvor, aber ohne x, und y ist jetzt eine Binomialvariable der Form . y weist auch innerhalb innerer Gruppen eine starke Überdispersion auf. Die meisten der sind nicht mehr als 2 oder 3 (oder weniger), um Schätzungen der Erfolgsraten jedes abzuleiten, habe ich den Beta-Binomial-Schrumpfungsschätzer , wobei undwerden von MLE für jede innere Gruppe separat geschätzt. Das ist schon einigermaßen ausreichend, aber die Datensparsamkeit plagt mich immer noch, deshalb möchte ich alle verfügbaren Daten nutzen. Aus der einen Perspektive ist dieses Problem einfacher, da es keine Kovariate gibt, aus der anderen Perspektive macht es die Binomialnatur schwieriger. Hat jemand eine hohe (oder niedrige!) Führung?