Grundsätzlich denke ich, ist der deutlichste Unterschied, wenn Sie einen Faktor als zufällig modellieren, dass angenommen wird, dass die Effekte aus einer gemeinsamen Normalverteilung stammen.
Wenn Sie beispielsweise ein Modell für Noten haben und die Daten Ihrer Schüler aus verschiedenen Schulen berücksichtigen möchten und die Schule als Zufallsfaktor modellieren, bedeutet dies, dass Sie davon ausgehen, dass die schulweiten Durchschnittswerte normal verteilt sind. Das bedeutet, dass zwei Variationsquellen modelliert werden: die schulinterne Variabilität der Schulnoten und die Variabilität zwischen den Schulen.
Dies führt zu einem sogenannten partiellen Pooling . Betrachten Sie zwei Extreme:
- Die Schule hat keine Auswirkungen (zwischen den Schulen ist die Variabilität Null). In diesem Fall wäre ein lineares Modell, das die Schule nicht berücksichtigt, optimal.
- Die Schulvariabilität ist größer als die Variabilität der Schüler. Dann müssen Sie im Grunde auf der Schulebene anstatt auf der Schülerebene arbeiten (weniger Stichproben). Dies ist im Grunde das Modell, bei dem Sie die Schule mit festen Effekten erklären. Dies kann problematisch sein, wenn Sie nur wenige Proben pro Schule haben.
Durch die Schätzung der Variabilität auf beiden Ebenen geht das gemischte Modell einen intelligenten Kompromiss zwischen diesen beiden Ansätzen ein. Insbesondere wenn Sie nicht so viele Schüler pro Schule haben, bedeutet dies, dass die Auswirkungen für die einzelnen Schulen nach Modell 2 gegenüber dem Gesamtmittel von Modell 1 abnehmen.
Das liegt daran, dass das Modell besagt, dass wenn Sie eine Schule mit zwei Schülern haben, was besser als "normal" für die Schulbevölkerung ist, es wahrscheinlich ist, dass ein Teil dieses Effekts dadurch erklärt wird, dass die Schule Glück bei der Wahl hatte von den beiden Studenten angeschaut. Dies geschieht nicht blind, sondern abhängig von der Schätzung der Variabilität innerhalb der Schule. Dies bedeutet auch, dass Effektstufen mit weniger Stichproben stärker zum Gesamtmittelwert gezogen werden als bei großen Schulen.
Wichtig ist, dass Sie auf der Ebene des Zufallsfaktors austauschbar sein müssen. Das bedeutet in diesem Fall, dass die Schulen (nach Ihrem Wissen) austauschbar sind und Sie nichts wissen, was sie auszeichnet (außer einer Art Ausweis). Wenn Sie zusätzliche Informationen haben, können Sie diese als zusätzlichen Faktor hinzufügen. Es reicht aus, wenn die Schulen unter der Bedingung austauschbar sind, dass andere Informationen berücksichtigt werden.
Zum Beispiel wäre es sinnvoll anzunehmen, dass in New York lebende 30-jährige Erwachsene geschlechtsabhängig austauschbar sind. Wenn Sie mehr Informationen haben (Alter, ethnische Zugehörigkeit, Bildung), ist es sinnvoll, diese Informationen ebenfalls aufzunehmen.
OTH Wenn Sie mit einer Kontrollgruppe und drei sehr unterschiedlichen Krankheitsgruppen studiert haben, ist es nicht sinnvoll, die Gruppe als zufällig zu modellieren, da bestimmte Krankheiten nicht austauschbar sind. Viele Leute mögen den Schrumpfeffekt jedoch so gut, dass sie immer noch für ein Zufallseffektmodell plädieren würden, aber das ist eine andere Geschichte.
Mir ist aufgefallen, dass ich mich nicht zu sehr mit Mathematik befasst habe, aber im Grunde besteht der Unterschied darin, dass das Zufallseffektmodell einen normalverteilten Fehler sowohl auf der Ebene der Schulen als auch auf der Ebene der Schüler schätzte, während das Modell mit festem Effekt den Fehler gerade noch aufweist das Niveau der Schüler. Insbesondere bedeutet dies, dass jede Schule ihre eigene Ebene hat, die nicht durch eine gemeinsame Verteilung mit den anderen Ebenen verbunden ist. Dies bedeutet auch, dass das feste Modell keine Extrapolation auf einen Schüler zulässt, der nicht in den Originaldaten enthalten ist, während das Zufallseffektmodell dies mit einer Variabilität tut, die die Summe aus dem Schülerniveau und der Variabilität des Schulniveaus ist. Wenn Sie speziell an der Wahrscheinlichkeit interessiert sind, könnten wir das in Angriff nehmen.