Ich bin verwirrt über die Normalitätsannahme bei ANOVA mit wiederholten Messungen. Insbesondere frage ich mich, welche Art von Normalität genau erfüllt sein sollte. Beim Lesen der Literatur und der Antworten zum Lebenslauf bin ich auf drei unterschiedliche Formulierungen dieser Annahme gestoßen.
Die abhängige Variable innerhalb jeder (wiederholten) Bedingung sollte normal verteilt werden.
Es wird oft behauptet, dass die RANOVA die gleichen Annahmen wie die ANOVA hat, zuzüglich der Sphärizität. Das ist die Behauptung in der Entdeckungsstatistik von Field sowie im Wikipedia- Artikel zu diesem Thema und in Lowrys Text .
Die Residuen (Differenzen zwischen allen möglichen Paaren?) Sollten normal verteilt sein.
Ich fand diese Aussage in mehreren Antworten im Lebenslauf ( 1 , 2 ). In Analogie von rANOVA zum gepaarten t-Test mag dies auch intuitiv erscheinen.
Multivariate Normalität sollte erfüllt sein.
Wikipedia und diese Quelle erwähnen dies. Ich weiß auch, dass RANOVA mit MANOVA getauscht werden kann, was diese Behauptung möglicherweise verdient.
Sind diese irgendwie gleichwertig? Ich weiß, dass multivariate Normalität bedeutet, dass jede Linearkombination der DVs normalverteilt ist, also würde 3. natürlich 2. einschließen, wenn ich letzteres richtig verstehe.
Wenn diese nicht gleich sind, welche ist die "wahre" Annahme der RANOVA? Können Sie eine Referenz angeben?
Mir scheint, es gibt die größte Unterstützung für die erste Behauptung. Dies steht jedoch nicht im Einklang mit den Antworten, die normalerweise hier gegeben werden.
Linear gemischte Modelle
Aufgrund des @ utobi-Hinweises verstehe ich jetzt, wie sich rANOVA als lineares gemischtes Modell umschreiben lässt. Genauer gesagt, modellieren , wie der Blutdruck mit der Zeit ändert, würde ich den erwarteten Wert modelliert als: wobei y i j Messungen von Blutdruck, ein i das durchschnittliche Blut Druck des i -ten Subjekts und t i j als - te Mal , wenn das gemessen wurde -te Subjekt,
Schließlich habe ich versucht zu überlegen, was dies für die Normalität bedeutet, aber zu wenig Erfolg. Um McCulloch und Searle (2001, S. 35. Gleichung (2.14)) zu paraphrasieren:
Ich verstehe das so
4. Die Daten jedes Einzelnen müssen normal verteilt sein, dies ist jedoch nicht zumutbar, um mit wenigen Zeitpunkten getestet zu werden.
Ich nehme den dritten Ausdruck, um das zu bedeuten
5. Die Durchschnittswerte der einzelnen Fächer sind normalerweise verteilt. Beachten Sie, dass dies zusätzlich zu den drei oben genannten zwei weitere Möglichkeiten sind.
McCulloch, CE & Searle, SR (2001). Generalisierte, lineare und gemischte Modelle . New York: John Wiley & Sons, Inc.