Betrachten Sie ANOVA mit wiederholten A
Messungen (RM-ANOVA) mit einem Faktor innerhalb des Subjekts und mehreren Messungen pro Subjekt für jede Stufe von A
.
Es ist eng verwandt mit der Zwei-Wege-ANOVA mit zwei Faktoren: A
und subject
. Sie verwenden identische Zersetzung der Summe der Quadrate in vier Teile: A
, subject
, A⋅subject
, und residual
. Die Zweiwege-ANOVA testet jedoch die Wirkung von A durch Vergleichen von SS von A mit der verbleibenden SS, während RM-ANOVA die Wirkung von A durch Vergleichen von SS von A mit der A Subjekt-Interaktion SS testet .
Warum der Unterschied?
- Ergibt sich dieser Unterschied automatisch aus der Struktur der Daten mit wiederholten Messungen oder handelt es sich um eine Konvention?
- Entspricht dieser Unterschied zwischen Zweiwege-ANOVA und RM-ANOVA dem Testen von zwei verschiedenen Nullen? Wenn ja, was genau sind sie und warum würden wir in diesen beiden Fällen unterschiedliche Nullen verwenden?
- Der Zwei-Wege-ANOVA-Test kann als F-Test zwischen zwei verschachtelten Modellen verstanden werden: dem vollständigen Modell und dem Modell ohne A. Kann RM-ANOVA auf ähnliche Weise verstanden werden?
(Wenn es nur eine Messung pro Proband für jede Stufe von A gibt, verschwindet die Art der Unterscheidung, da A Subjekt und Restvariation nicht entwirrt werden können: Entspricht die Einweg-ANOVA mit wiederholten Messungen einer Zweiweg-ANOVA? )
Demonstration
Ich werde Spielzeugdaten verwenden, d2
die in http://dwoll.de/rexrepos/posts/anovaMixed.html generiert wurden . Dieselbe Webseite zeigt die korrekte Syntax für RM-ANOVA.
# Discarding between-subject factors and leaving only one within-subject factor
d = d2[d2$Xb1=='CG' & d2$Xb2 == 'f', c(1,4,6)]
(Siehe reproduzierbare Version hier auf Pastebin .) Die Daten sehen folgendermaßen aus:
id Xw1 Y
1 s1 A 28.6
2 s1 A 96.6
3 s1 A 64.8
4 s1 B 107.5
5 s1 B 77.3
6 s1 B 120.9
7 s1 C 141.2
8 s1 C 124.1
9 s1 C 88.0
10 s2 A 86.7
...
Hier ist eine Zwei-Wege-ANOVA: summary(aov(Y ~ Xw1*id, d))
Df Sum Sq Mean Sq F value Pr(>F)
Xw1 2 95274 47637 16.789 3.73e-07 ***
id 19 31359 1650 0.582 0.913
Xw1:id 38 71151 1872 0.660 0.929
Residuals 120 340490 2837
Hier ist RM-ANOVA: summary(aov(Y ~ Xw1 + Error(id/Xw1), d))
Error: id
Df Sum Sq Mean Sq F value Pr(>F)
Residuals 19 31359 1650
Error: id:Xw1
Df Sum Sq Mean Sq F value Pr(>F)
Xw1 2 95274 47637 25.44 9.73e-08 ***
Residuals 38 71151 1872
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
Residuals 120 340490 2837
Beachten Sie die identische SS-Zerlegung, aber Zweiwege-ANOVA-Tests Xw1
gegen den Rest, während RM-ANOVA-Tests Xw1
gegen die Xw1:id
Wechselwirkung.
Warum?
Diese Frage bezieht sich auf das Schreiben des Fehlerterms in ANOVA mit wiederholten Messungen in R: Fehler (Betreff) vs Fehler (Betreff / Zeit) . Wenn wir versuchen, Error(id)
anstelle des Error(id/Xw1)
obigen Beispiels zu verwenden, Xw1
wird dies auf Xw1:id
Wechselwirkungen getestet, die zusammen mit der Restvariation zusammengefasst werden.
(Das gleiche Problem tritt bei der faktoriellen RM-ANOVA mit mehreren subjektinternen Faktoren auf, bei der jeder Faktor oder jede Interaktion gegen seinen eigenen "Fehlerterm", auch "Fehlerschicht" genannt, getestet wird. Diese Fehlerschichten werden immer durch die entsprechende Interaktion mit dem Block angegeben / plot / subject variable id
.)
subject
(und alle seine Wechselwirkungen!) Als zufällig hinausläuft , während die 2-Wege-ANOVA ihn als behandelt Fest. Ich muss mehr darüber nachdenken, um alle Details herauszufinden.