Mehrebenenmodell im Vergleich zu separaten Modellen für jede Ebene


10

Was sind die Vor- und Nachteile der Ausführung separater Modelle gegenüber der Mehrebenenmodellierung?

Nehmen wir insbesondere an, eine Studie untersuchte Patienten, die in Arztpraxen verschachtelt sind, die in Ländern verschachtelt sind. Was sind die Vor- und Nachteile der Ausführung separater Modelle für jedes Land im Vergleich zu einem verschachtelten Modell mit drei Ebenen?


2
Technisch gesehen benötigen Sie eine ganze Reihe von Level-3-Einheiten, wenn Sie in einem 3-Level-Modell unvoreingenommene Parameterschätzungen erhalten möchten (im Allgemeinen ist die Stichprobengröße in einem Mehrebenenmodell auf höchster Ebene besonders wichtig) Bei einer großen Zufallsstichprobe von Ländern (vielleicht 50+) sollten Sie wahrscheinlich in Betracht ziehen, separate 2-Ebenen-Modelle auszuführen. Wenn Sie nur wenige Länder haben, können Sie das Land als kategorialen Level-2-Prädiktor in einem 2-Ebenen-Modell behandeln
Patrick Coulombe

Hi @gung ich war weg, ich werde sie mir jetzt ansehen.
Peter Flom - Wiedereinsetzung von Monica

Antworten:


6

Die Frage ist veraltet, aber ich denke, es ist sehr wichtig. Die beste Antwort, die ich bekommen kann, stammt aus dem Buch "Multilevel Analysis Techniques and Applications, Second Edition" von Joop J Hox (2010).

Angenommen, hierarchische Daten auf zwei Ebenen mit p erklärende Variablen auf der untersten Ebene und qerklärende Variablen auf höchster Ebene. Dann schreibt er auf Seite 55:

Ein gewöhnliches einstufiges Regressionsmodell für dieselben Daten würde nur den Achsenabschnitt, eine Fehlervarianz und die p + q-Regressionssteigungen schätzen. Die Überlegenheit des mehrstufigen Regressionsmodells ist klar, wenn man bedenkt, dass die Daten in Gruppen zusammengefasst sind. Wenn wir 100 Gruppen haben, erfordert die separate Schätzung eines gewöhnlichen multiplen Regressionsmodells in jeder Gruppe die Schätzung von 100 × (1 Regressionsabschnitt + 1 Restvarianz + p Regressionssteigungen) plus mögliche Wechselwirkungen mit den Variablen auf q Gruppenebene. Die mehrstufige Regression ersetzt das Schätzen von 100 Abschnitten durch Schätzen eines durchschnittlichen Abschnitts plus seiner Restvarianz über Gruppen unter der Annahme einer Normalverteilung für diese Residuen. Somit, Die mehrstufige Regressionsanalyse ersetzt das Schätzen von 100 separaten Abschnitten durch Schätzen von zwei Parametern (Mittelwert und Varianz der Abschnitte) plus einer Normalitätsannahme. Die gleiche Vereinfachung wird für die Regressionssteigungen verwendet. Anstatt 100 Steigungen für die erklärende Variable Pupillengeschlecht zu schätzen, schätzen wir die durchschnittliche Steigung zusammen mit ihrer Varianz über Gruppen und nehmen an, dass die Verteilung der Steigungen normal ist. Trotz einer bescheidenen Anzahl erklärender Variablen impliziert die mehrstufige Regressionsanalyse ein kompliziertes Modell. Im Allgemeinen möchten wir nicht das gesamte Modell abschätzen, da dies wahrscheinlich zu Rechenproblemen führt, aber auch, weil es sehr schwierig ist, ein derart komplexes Modell zu interpretieren.

Das ist für die Beschreibung. Jetzt beantworten die Seiten 29-30 Ihre Frage genauer.

Die vorhergesagten Abschnitte und Steigungen für die 100 Klassen sind nicht identisch mit den Werten, die wir erhalten würden, wenn wir 100 separate gewöhnliche Regressionsanalysen in jeder der 100 Klassen unter Verwendung von Standardtechniken für gewöhnliche kleinste Quadrate (OLS) durchführen würden. Wenn wir die Ergebnisse von 100 separaten OLS-Regressionsanalysen mit den Werten einer mehrstufigen Regressionsanalyse vergleichen würden, würden wir feststellen, dass die Ergebnisse der separaten Analysen variabler sind. Dies liegt daran, dass die mehrstufigen Schätzungen der Regressionskoeffizienten der 100 Klassen gewichtet werden. Dies sind sogenannte empirische Bayes (EB) - oder Schrumpfungsschätzungen: ein gewichteter Durchschnitt der spezifischen OLS-Schätzung in jeder Klasse und des Gesamtregressionskoeffizienten, der für alle ähnlichen Klassen geschätzt wird.

Infolgedessen werden die Regressionskoeffizienten auf den mittleren Koeffizienten für den gesamten Datensatz zurückgeschrumpft. Das Schrumpfgewicht hängt von der Zuverlässigkeit des geschätzten Koeffizienten ab. Koeffizienten, die mit geringer Genauigkeit geschätzt werden, schrumpfen mehr als sehr genau geschätzte Koeffizienten. Die Genauigkeit der Schätzung hängt von zwei Faktoren ab: der Gruppenstichprobengröße und dem Abstand zwischen der gruppenbasierten Schätzung und der Gesamtschätzung. Schätzungen für kleine Gruppen sind weniger zuverlässig und schrumpfen stärker als Schätzungen für große Gruppen. Wenn andere Dinge gleich sind, werden Schätzungen, die sehr weit von der Gesamtschätzung entfernt sind, als weniger zuverlässig angenommen und sie schrumpfen stärker als Schätzungen, die nahe am Gesamtdurchschnitt liegen. Die verwendete statistische Methode wird als empirische Bayes-Schätzung bezeichnet. Aufgrund dieses Schrumpfeffekts empirische Bayes-Schätzer sind voreingenommen. Sie sind jedoch normalerweise präziser, eine Eigenschaft, die oft nützlicher ist als unvoreingenommen zu sein (siehe Kendall, 1959).

Ich hoffe es ist befriedigend.


2

Die Angabe eines zufälligen Effekts beinhaltet die Annahme, dass die Mittelwerte dieser Ebenen Stichproben aus einer Normalverteilung sind. Es ist besser, sie als feste Effekte anzugeben, AKA-Dummy-Variablen, wenn diese Annahme nicht zu Ihren Daten passt. Auf diese Weise steuern Sie die gruppenweise Heterogenität im Mittelwert (auf dieser Ebene), berücksichtigen jedoch NICHT die Heterogenität der Antworten auf Ihre Variablen auf niedrigerer Ebene.

Wenn Sie eine Heterogenität als Reaktion auf Ihre erklärenden Variablen auf niedrigerer Ebene erwarten, sind separate Modelle sinnvoll, es sei denn, Sie möchten eine Art Zufallskoeffizientenmodell ausführen (was wiederum die Annahme beinhaltet, dass die Koeffizienten normalverteilt sind).

(Ich glaube, es gibt Methoden für nicht normale zufällige Effekte, aber nichts ist so weit verbreitet oder zugänglich wie ich)


1

Vorteil: Die Fähigkeit, explizit auf Unterschiede in Parametern nach Cluster zu testen (dh Unterschiede in der Signifikanz bedeuten keine signifikanten Unterschiede).


2
Diese Antwort ist viel zu kurz. Eher ein Kommentar als eine Antwort.
Eric Peterson
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.