Ich fürchte, ich könnte die nuancierte und vielleicht unbefriedigende Antwort haben, dass es sich um eine subjektive Entscheidung des Forschers oder Datenanalysten handelt. Wie an anderer Stelle in diesem Thread erwähnt, reicht es nicht aus, einfach zu sagen, dass die Daten eine "verschachtelte Struktur" haben. Um fair zu sein, beschreiben so viele Bücher, wann mehrstufige Modelle verwendet werden müssen. Zum Beispiel habe ich gerade Joop Hox 'Buch Multilevel Analysis aus meinem Bücherregal gezogen, das diese Definition enthält:
Ein Mehrebenenproblem betrifft eine Population mit einer hierarchischen Struktur.
Selbst in einem ziemlich guten Lehrbuch scheint die ursprüngliche Definition kreisförmig zu sein. Ich denke, dies liegt teilweise an der Subjektivität der Bestimmung, wann welche Art von Modell verwendet werden soll (einschließlich eines Mehrebenenmodells).
Ein anderes Buch, West, Welch & Galeckis Linear Mixed Models, sagt, dass diese Modelle für:
Ergebnisvariablen, in denen die Residuen normal verteilt sind, aber möglicherweise nicht unabhängig sind oder eine konstante Varianz aufweisen. Zu den Studiendesigns, die zu Datensätzen führen, die mithilfe von LMMs angemessen analysiert werden können, gehören (1) Studien mit Clusterdaten, z. B. Schüler in Klassenzimmern, oder Versuchspläne mit zufälligen Blöcken, z. B. Rohstoffchargen für einen industriellen Prozess, und (2) Längsschnittstudien oder Studien mit wiederholten Messungen, bei denen Probanden wiederholt über die Zeit oder unter verschiedenen Bedingungen gemessen werden.
Finch, Bolin & Kelleys Mehrebenenmodellierung in R spricht auch über die Verletzung der iid-Annahme und der korrelierten Residuen:
Von besonderer Bedeutung im Zusammenhang mit der Mehrebenenmodellierung ist die Annahme [in der Standardregression] von unabhängig verteilten Fehlerausdrücken für die einzelnen Beobachtungen innerhalb einer Stichprobe. Diese Annahme bedeutet im Wesentlichen, dass für die abhängige Variable keine Beziehungen zwischen Personen in der Stichprobe bestehen, sobald die unabhängigen Variablen in der Analyse berücksichtigt werden.
Ich glaube, dass ein Mehrebenenmodell sinnvoll ist, wenn Grund zu der Annahme besteht, dass Beobachtungen nicht unbedingt unabhängig voneinander sind. Was auch immer "Cluster" für diese Nichtunabhängigkeit verantwortlich ist, kann modelliert werden.
Ein naheliegendes Beispiel wären Kinder in Klassenzimmern - sie interagieren alle miteinander, was dazu führen kann, dass ihre Testergebnisse nicht unabhängig sind. Was ist, wenn in einem Klassenzimmer jemand eine Frage stellt, die dazu führt, dass Material in dieser Klasse behandelt wird, das in anderen Klassen nicht behandelt wird? Was ist, wenn der Lehrer für einige Klassen wacher ist als für andere? In diesem Fall würde es eine gewisse Nichtunabhängigkeit der Daten geben. In mehrstufigen Wörtern können wir erwarten, dass eine gewisse Varianz in der abhängigen Variablen auf den Cluster (dh die Klasse) zurückzuführen ist.
Ihr Beispiel eines Hundes gegenüber einem Elefanten hängt von den unabhängigen und abhängigen Variablen ab, die von Interesse sind, denke ich. Nehmen wir zum Beispiel an, wir fragen, ob Koffein einen Einfluss auf das Aktivitätsniveau hat. Tiere aus dem ganzen Zoo werden nach dem Zufallsprinzip ausgewählt, um entweder ein koffeinhaltiges Getränk oder ein Kontrollgetränk zu erhalten.
Wenn wir ein Forscher sind, der sich für Koffein interessiert, könnten wir ein Mehrebenenmodell spezifizieren, da uns die Wirkung von Koffein wirklich wichtig ist. Dieses Modell würde wie folgt angegeben:
activity ~ condition + (1+condition|species)
Dies ist besonders hilfreich, wenn es eine große Anzahl von Arten gibt, über die wir diese Hypothese testen. Ein Forscher könnte jedoch an den artspezifischen Wirkungen von Koffein interessiert sein. In diesem Fall könnten sie Arten als festen Effekt angeben:
activity ~ condition + species + condition*species
Dies ist offensichtlich ein Problem, wenn beispielsweise 30 Arten vorhanden sind, wodurch ein unhandliches 2 x 30-Design entsteht. Sie können jedoch ziemlich kreativ werden, wie man diese Beziehungen modelliert.
Einige Forscher plädieren beispielsweise für eine noch umfassendere Verwendung der Mehrebenenmodellierung. Gelman, Hill & Yajima (2012) argumentieren, dass die Mehrebenenmodellierung als Korrektur für Mehrfachvergleiche verwendet werden könnte - selbst in experimentellen Untersuchungen, bei denen die Struktur der Daten nicht offensichtlich hierarchischer Natur ist:
Bei der Modellierung mehrerer Vergleiche mit mehr Struktur treten schwierigere Probleme auf. Angenommen, wir haben fünf Ergebnismaße, drei Arten von Behandlungen und Untergruppen, die nach zwei Geschlechtern und vier Rassengruppen klassifiziert sind. Wir möchten diese 2 × 3 × 4 × 5-Struktur nicht als 120 austauschbare Gruppen modellieren. Selbst in diesen komplexeren Situationen denken wir, dass die Mehrebenenmodellierung die klassischen Mehrfachvergleichsverfahren ersetzen sollte und wird.
Probleme können auf verschiedene Arten modelliert werden, und in mehrdeutigen Fällen scheinen mehrere Ansätze ansprechend zu sein. Ich denke, unsere Aufgabe ist es, einen vernünftigen, informierten Ansatz zu wählen und dies transparent zu tun.