Wiederholte ANOVA-Messungen vs. faktorielle ANOVA mit Subjektfaktor: Verständnis der „Fehlerschichten“ und des Error () -Terms in aov


8

Betrachten Sie ANOVA mit wiederholten AMessungen (RM-ANOVA) mit einem Faktor innerhalb des Subjekts und mehreren Messungen pro Subjekt für jede Stufe von A.

Es ist eng verwandt mit der Zwei-Wege-ANOVA mit zwei Faktoren: Aund subject. Sie verwenden identische Zersetzung der Summe der Quadrate in vier Teile: A, subject, A⋅subject, und residual. Die Zweiwege-ANOVA testet jedoch die Wirkung von A durch Vergleichen von SS von A mit der verbleibenden SS, während RM-ANOVA die Wirkung von A durch Vergleichen von SS von A mit der A Subjekt-Interaktion SS testet .

Warum der Unterschied?

  1. Ergibt sich dieser Unterschied automatisch aus der Struktur der Daten mit wiederholten Messungen oder handelt es sich um eine Konvention?
  2. Entspricht dieser Unterschied zwischen Zweiwege-ANOVA und RM-ANOVA dem Testen von zwei verschiedenen Nullen? Wenn ja, was genau sind sie und warum würden wir in diesen beiden Fällen unterschiedliche Nullen verwenden?
  3. Der Zwei-Wege-ANOVA-Test kann als F-Test zwischen zwei verschachtelten Modellen verstanden werden: dem vollständigen Modell und dem Modell ohne A. Kann RM-ANOVA auf ähnliche Weise verstanden werden?

(Wenn es nur eine Messung pro Proband für jede Stufe von A gibt, verschwindet die Art der Unterscheidung, da A Subjekt und Restvariation nicht entwirrt werden können: Entspricht die Einweg-ANOVA mit wiederholten Messungen einer Zweiweg-ANOVA? )


Demonstration

Ich werde Spielzeugdaten verwenden, d2die in http://dwoll.de/rexrepos/posts/anovaMixed.html generiert wurden . Dieselbe Webseite zeigt die korrekte Syntax für RM-ANOVA.

# Discarding between-subject factors and leaving only one within-subject factor
d = d2[d2$Xb1=='CG' & d2$Xb2 == 'f', c(1,4,6)]

(Siehe reproduzierbare Version hier auf Pastebin .) Die Daten sehen folgendermaßen aus:

     id Xw1     Y
1    s1   A  28.6
2    s1   A  96.6
3    s1   A  64.8
4    s1   B 107.5
5    s1   B  77.3
6    s1   B 120.9
7    s1   C 141.2
8    s1   C 124.1
9    s1   C  88.0
10   s2   A  86.7
...

Hier ist eine Zwei-Wege-ANOVA: summary(aov(Y ~ Xw1*id, d))

             Df Sum Sq Mean Sq F value   Pr(>F)    
Xw1           2  95274   47637  16.789 3.73e-07 ***
id           19  31359    1650   0.582    0.913    
Xw1:id       38  71151    1872   0.660    0.929    
Residuals   120 340490    2837                 

Hier ist RM-ANOVA: summary(aov(Y ~ Xw1 + Error(id/Xw1), d))

Error: id
          Df Sum Sq Mean Sq F value Pr(>F)
Residuals 19  31359    1650               

Error: id:Xw1
          Df Sum Sq Mean Sq F value   Pr(>F)    
Xw1        2  95274   47637   25.44 9.73e-08 ***
Residuals 38  71151    1872                     

Error: Within
           Df Sum Sq Mean Sq F value Pr(>F)
Residuals 120 340490    2837            

Beachten Sie die identische SS-Zerlegung, aber Zweiwege-ANOVA-Tests Xw1gegen den Rest, während RM-ANOVA-Tests Xw1gegen die Xw1:idWechselwirkung.

Warum?

Diese Frage bezieht sich auf das Schreiben des Fehlerterms in ANOVA mit wiederholten Messungen in R: Fehler (Betreff) vs Fehler (Betreff / Zeit) . Wenn wir versuchen, Error(id)anstelle des Error(id/Xw1)obigen Beispiels zu verwenden, Xw1wird dies auf Xw1:idWechselwirkungen getestet, die zusammen mit der Restvariation zusammengefasst werden.

(Das gleiche Problem tritt bei der faktoriellen RM-ANOVA mit mehreren subjektinternen Faktoren auf, bei der jeder Faktor oder jede Interaktion gegen seinen eigenen "Fehlerterm", auch "Fehlerschicht" genannt, getestet wird. Diese Fehlerschichten werden immer durch die entsprechende Interaktion mit dem Block angegeben / plot / subject variable id.)


Relevanter Thread: r.789695.n4.nabble.com/AOV-and-Error-td865845.html - aber keine echte Antwort.
Amöbe

Okay, ich habe @ JakeWestfalls Artikel jakewestfall.org/publications/JWK.pdf noch einmal gelesen und festgestellt, dass das ganze Problem auf den RM-ANOVA-Behandlungseffekt subject(und alle seine Wechselwirkungen!) Als zufällig hinausläuft , während die 2-Wege-ANOVA ihn als behandelt Fest. Ich muss mehr darüber nachdenken, um alle Details herauszufinden.
Amöbe

Für Punkt (2) ist die Nullhypothese genau das, was das Verhältnis der erwarteten mittleren Quadrate der entsprechenden zwei Quadratsummen gleich eins und des Nichtzentralitätsparameters, der beiden Quadratsummen gleich 0 entspricht, so macht, dass das Der Wert für die Statistik ist berechenbar. Mir ist derzeit nicht klar, warum wir alle drei dieser Ziele in den Nullen erreichen können, die wir in ANOVA gewohnt sind, aber es scheint, als müssten wir uns nur auf das Verhältnis des UMS konzentrieren, wenn die Effekte zufällig sind und der Zähler-SS-Nichtzentralitätsparameter, wenn der (Zähler-) Effekt festgelegt ist. F.pF.
user795305

Diese Kommentare beziehen sich auf den Satz von Cochran ( en.wikipedia.org/wiki/Cochran%27s_theorem ). (Das Buch, das ich als ANOVA-Referenz verwende, nennt das übrigens "Bhat's Lemma".)
user795305

Ähnliche Frage hier, Verständnis der geteilten Handlung , aber auch dort noch keine großartige Antwort
Aaron verließ Stack Overflow am

Antworten:


2

... Zweiwege-ANOVA testet die Wirkung von A durch Vergleichen von SS von A mit dem Rest-SS, während RM-ANOVA die Wirkung von A durch Vergleichen von SS von A mit der A⋅-Subjekt-Wechselwirkung SS testet.

1) Ergibt sich dieser Unterschied automatisch aus der Struktur der Daten mit wiederholten Messungen oder handelt es sich um eine Konvention?

Es folgt aus der Struktur der Daten mit wiederholten Messungen. Das Grundprinzip der Varianzanalyse besteht darin, dass wir die Variation zwischen den Ebenen einer Behandlung mit der Variation zwischen den Einheiten vergleichen, die diese Behandlung erhalten haben. Was den Fall der wiederholten Messung etwas schwierig macht, ist die Schätzung dieser zweiten Variation.

In diesem einfachsten Fall interessieren uns die Unterschiede zwischen den Niveaus von A. An wie vielen Einheiten haben wir diesen Unterschied gemessen? Es ist die Anzahl der Probanden, nicht die Anzahl der Beobachtungen. Das heißt, jedes Thema gibt uns eine zusätzliche unabhängige Information über den Unterschied, nicht jede Beobachtung. Das Hinzufügen von mehr wiederholten Messungen erhöht die Genauigkeit unserer Informationen zu jedem Thema, gibt uns jedoch nicht mehr Themen.

Was die RM-Anova tut, wenn sie die A-Subjekt-Interaktion als Fehlerterm verwendet, besteht darin, die Variation der Unterschiede zwischen den A-Niveaus zwischen Subjekten korrekt als Variation zum Testen des A-Level-Effekts zu verwenden. Bei Verwendung des Beobachtungsfehlers wird stattdessen die Variation der wiederholten Messungen für jedes Individuum verwendet, was nicht korrekt ist.

Stellen Sie sich einen Fall vor, in dem Sie immer mehr Daten zu nur wenigen Personen erfassen. Wenn Sie den Beobachtungsstufenfehler verwenden, würden Sie schließlich statistische Signifikanz erreichen, obwohl Sie nur ein paar Personen haben. Sie benötigen mehr Personen, nicht mehr Daten, um die Leistung wirklich zu steigern.

2) Entspricht dieser Unterschied zwischen Zweiwege-ANOVA und RM-ANOVA dem Testen von zwei verschiedenen Nullen? Wenn ja, was genau sind sie und warum würden wir in diesen beiden Fällen unterschiedliche Nullen verwenden?

Nein, dieselbe Nullhypothese. Was anders ist, ist, wie wir die Teststatistik und ihre Nullverteilung schätzen.

3) Der Zwei-Wege-ANOVA-Test kann als F-Test zwischen zwei verschachtelten Modellen verstanden werden: dem vollständigen Modell und dem Modell ohne A. Kann RM-ANOVA auf ähnliche Weise verstanden werden?

Ja, aber vielleicht nicht so, wie Sie es sich erhoffen. Wie Sie in der Ausgabe von sehen aov, besteht eine Art, über diese Art von Modellen nachzudenken, darin, dass es sich tatsächlich um mehrere Modelle in einem handelt, mit einem Modell für jede Ebene.

Man kann die Modelle für höhere Ebenen individuell anpassen, indem man die Daten über die niedrigeren Ebenen mittelt. Das heißt, ein RM-Anova-Test für A entspricht einer Standard-Anova für die gemittelten Daten. Dann kann man Modelle auf die übliche Weise vergleichen.

> library(plyr)
> d2 <- ddply(d, ~Xw1 + id, summarize, Y=mean(Y))
> a1 <- aov(Y ~ id, d2)
> a2 <- aov(Y ~ Xw1+id, d2)
> anova(a1, a2)
Analysis of Variance Table

Model 1: Y ~ id
Model 2: Y ~ Xw1 + id
  Res.Df   RSS Df Sum of Sq      F    Pr(>F)    
1     40 55475                                  
2     38 23717  2     31758 25.442 9.734e-08 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Alternativ kann man aovmit allen Daten, jedoch ohne den interessierenden Begriff, die vollständige Anpassung vornehmen und dann die Anpassung mit der vollständigen aovmit der interessierenden Laufzeit vergleichen. Um dann Modelle zu vergleichen, müssen Sie die Ebene des Modells auswählen, das Sie haben geändert (hier das id:Xw1Niveau) und dann können Sie diese beiden Modelle vergleichen.

> summary(aov(Y ~ 1 + Error(id/Xw1), d))

Error: id
          Df Sum Sq Mean Sq F value Pr(>F)
Residuals 19  31359    1650               

Error: id:Xw1
          Df Sum Sq Mean Sq F value Pr(>F)
Residuals 40 166426    4161               

Error: Within
           Df Sum Sq Mean Sq F value Pr(>F)
Residuals 120 340490    2837               
> (F <- ((166426 - 71151)/2) / (71151/38))
[1] 25.44202
> pf(F, 2, 38, lower=FALSE)
[1] 9.732778e-08

(+1) Danke, dass du dir die Zeit genommen hast, dies aufzuschreiben! Dies ist eine interessante Perspektive, die es uns ermöglicht, eine Vorstellung davon zu gewinnen, warum es natürlich ist, im Fall wiederholter Messungen mit der Interaktionssumme der Quadrate zu vergleichen. Es scheint jedoch nicht gelungen zu sein, die Details des Tests zu klären, da Sie fälschlicherweise (gemäß den Argumenten in meiner Antwort) behaupten, dass die Nullhypothesen dieselben sind. Der letzte Absatz meiner Antwort schreibt, was ich aus den Nullhypothesen abgeleitet habe. Bitte lassen Sie mich wissen, wenn Sie denken, dass ich mich irre!
user795305

Ich denke, wir müssen unterscheiden, was getestet wird und was eine Annahme der Nullhypothese ist (was Teil dessen ist, was ich meine, wenn ich sage, dass die Nullverteilung unterschiedlich ist). Das σ ^ 2_ {id ∗ Xw1} = 0, das Sie haben, wird nicht tatsächlich getestet. Sie können Daten haben, bei denen dies überhaupt nicht wahr ist. Wenn X_ {w1j} jedoch für alle j genau gleich 0 ist, werden Sie das nicht ablehnen Null.
Aaron verließ Stack Overflow

1
Die Frage ist, was schließen Sie, wenn Sie die Null ablehnen? In beiden Fällen kommen Sie zu dem Schluss, dass Sie Beweise dafür haben, dass die Gruppenmittelwerte unterschiedlich sind. Sie schließen nicht, dass entweder die Gruppenmittelwerte unterschiedlich sind oder die Varianz groß ist. Das heißt, die Nullhypothese in beiden Fällen lautet einfach, dass alle Gruppenmittelwerte gleich sind. Was sich ändert, ist die Teststatistik, mit der wir das testen, und die Verteilung dieser Teststatistik.
Aaron verließ Stack Overflow

1
Ich habe festgestellt, dass mich Ihre ganze Argumentation verwirrt. Eine Nullhypothese wird nicht abgeleitet, sondern nur apriori angegeben. Anschließend wählt man eine Teststatistik aus und bestimmt deren Verteilung unter der Null. In beiden Fällen lautet die Nullhypothese einfach, dass alle Gruppenmittelwerte gleich sind.
Aaron verließ Stack Overflow

1
@Aaron Im Chat hat amoeba freundlicherweise darauf hingewiesen, dass ich Ihre Antwort auf Frage 2 anscheinend falsch verstanden habe. Ich habe Sie so interpretiert, dass im Fall wiederholter Messungen die Nullhypothesen der Teststatistik mit MSE in denom oder MS_inter im denom entsprechen sind gleich. (In der Tat ist mein letzter Absatz, auf den ich Sie hingewiesen habe, die Festlegung wiederholter Maßnahmen.) Es scheint jedoch, dass dies nicht das war, was Sie gesagt haben. Mein Fehler! amoeba und ich haben unsere Kommentare gelöscht, um zukünftige Leser nicht irrezuführen.
user795305

2

Dieser Hinweis hängt von den Ergebnissen in Mosers linearen Modellen ab: Ein mittlerer Modellansatz . Ich werde im Folgenden einige Ergebnisse aus diesem Buch zitieren. Als ich Ihre Frage sah, fing ich an, das Buch durchzusehen: Diese Notiz ist genau die Art und Weise, wie meine Gedanken organisiert waren.

Sei die Antwort, wobei μ die festen Effekte und Σ die zufälligen Effekte enthält.yNn(μ,Σ)μΣ

Nehmen Sie als die Summe der Quadrate, die jedem Term (Kovariaten und Wechselwirkungen) im Modell entsprechen. Beachten Sie, dass diese Quadratsummen nicht davon abhängen, ob Begriffe fest oder zufällig sind. Angenommen, jedes A i ist symmetrisch und idempotent, was für die meisten interessierenden Modelle gilt.yTAiyAi

Wenn es gilt die zu den Quadratsummen belaufen sich auf eine Zerlegung in orthogonale Unterräume entsprechen , da wir die angenommen haben A i - Projektoren sind und Σ = Σ i c i A i , durch Satz von Cochran ( Lemma 3.4.1), y T A i y ~ c i χ 2 d i ( μ T A i μ / C i ) , für d

I=iAi,
Ai
Σ=iciAi,
yTAiyciχdi2(μTAiμ/ci),
und y T A j y ist unabhängig von y T A k y für j k .di=tr(Ai)yTAjyyTAkyjk

Der Term ist in der Tatgenau danneine (zentrale)F-Statistik, wenn c j

F~=yTAjy/djyTAky/dkcjχdj2(μTAjμ/cj)/djckχdk2(μTAkμ/ck)/dk
F. wenn diese drei Bedingungen erfüllt sind, können wirp-Werteberechnen, die der Statistik ˜ F entsprechen . Diese Begriffe helfen im Grunde nur bei der Berechenbarkeit, da diecivon Varianzkomponenten abhängen und die Nichtzentralitätsparameter vom Mittelwertμabhängen. Die zweite Bedingung stellt sicher, dass ˜ F (mindestens) eine nicht zentraleF-Verteilung aufweist. Unter der zweiten Bedingung ergibt die dritte Bedingung, dass ˜ F eine zentraleF-Verteilung hat.
(1)cjck=1,(2)μTAjμ=0,(3)μTAkμ=0, and 
pF~ciμF~FF~F

EMSithyTAiy

EMSi:=1tr(Ai)E[yTAiy]=tr(AiΣ)+μTAiμtr(Ai)=ci+μTAiμtr(Ai),
tr(AiΣ)=citr(Ai)
EMSjEMSk=cj+μTAjμtr(Aj)ck+μTAkμtr(Ak)=1
(1)(2)(3)EMSF

(1),(2)(3)jcj/ck=1yTAjy=0k(1),(2)(3)k

μΣ

μΣk


yijk=μ0+idi+Xw1j+idXw1ij+R(idXw1)k(ij),
iidk

y=(y111,y112,y113,y121,y20,3,3)J¯Rm×m1mC=IJ¯Cx22=i(xix¯)2x

Aiμ0

SS(μ0)=n(y¯)2=(J¯J¯J¯)y22=yT(J¯J¯J¯)y,
J¯R20×20R3×3R3×3id
SS(id)=ijk(y¯iy¯)2=(CJ¯J¯)y22=yT(CJ¯J¯)y.
SS(id)idAXw1=J¯CJ¯EINichdX.w1=C.C.J.¯AR()=IIC

aovSS(R(idXw1))=yTAR()y

mY <- c()
for(j in 1:(nrow(d)/3)) {
  mY <- c(mY, rep(mean(d$Y[3*(j-1)+(1:3)]), 3))
}
sum((d$Y - mY)^2) #this is the residual sum of squares

ichd

E.[yichjk]]=μichj=μ0+ichdich+X.w1jk+ichdX.w1ichj
R.(ichdX.w1)k(ichj)ichichdN.(0,σ2)
yN.(μ,Σ)
μ=E[y]=(μ11,μ12,,μ20,3)13Σ=σ2(III)

5A

SS(Xw1)=yTAXw1yσ2χ(19)(1)(1)2(μTAXw1μ/σ2)
SS(R(idXw1))=yTAR()yσ2χ(20)(3)(2)2(μTAR()μ/σ2)

(1),(2),(3)(1)μTAR()μ=0μAR()(3)(2)0=μTAXw1μ=ijk(μijμ¯i)2μij=μ¯ii,jXw1j=0idXw1ij=0i,j

id(1)

RError()id/Xw1 = id + id:Xw1idErrorEINR.()+EINichdX.w1EINR.()


ichdichdichdX.w1

Σ=(a)σid2(IJJ)+σidXw12(ICJ)+σR()2(III)=σid2(3)(3)(Aμ0+Aid)+σidXw12(3)(AXw1+AidXw1)+σR()2(Aμ0+Aid+AXw1+AidXw1+AR())=((3)(3)σid2+σR()2)Aμ0+((3)(3)σid2+σR()2)Aid+((3)σidXw12+σR()2)AXw1+((3)σidXw12+σR()2)AidXw1+σR()2AR(),
JidXw1Xw1ICJ

idXw1E[yijk]=μj=μ0+Xw1jμ=1(μ1,μ2,μ3)1

(1)

cXw1cidXw1=(3)σidXw12+σR()2(3)σidXw12+σR()2=1,
cXw1cR()=(3)σidXw12+σR()2σR()21.
(3)μTAXw1idμ=0μTAR()μ=0(2)
μTAXw1μ=AXw1μ22=(J¯CJ¯)(1(μ1,μ2μ3)1)22=(20)(3)C(μ1,μ2μ3)22=(20)(3)j(Xw1j)2.

R(idXw1)(1)(2)(1)(2)

Xw1j=0j σidXw12=0Xw1j=0j


+1. Wow, vielen Dank. Ich werde einige Zeit brauchen, um diese Antwort zu verdauen. Ich bin mit der mathematischen Theorie des Hypothesentests in linearen Modellen nicht sehr vertraut, daher ist dies etwas schwer zu verstehen. Ich werde in den nächsten Tagen möglicherweise mit einigen Fragen auf Sie zurückkommen. Ich hatte eher damit gerechnet , eine Antwort im Stil des Beispiels auf den Seiten 2-3 dieses Papiers jakewestfall.org/publications/JWK.pdf zu erhalten , in dem die erwarteten mittleren Quadrate in mehreren Situationen zwischen fest und zufällig berechnet werden und alles folgt von dort. Es sieht so aus, als würden Sie über dasselbe sprechen, aber formeller.
Amöbe

Ich habe ein Beispiel beigefügt. (Das Schreiben kann ziemlich lange dauern!) Ich denke, es dauert einige Zeit, bis Sie sich mit Kronecker-Produktmanipulationen vertraut gemacht haben, aber danach ist dies leichter verständlich. Außerdem finde ich in der Antwort immer wieder Tippfehler. Bitte lassen Sie mich wissen, wenn Sie denken, dass es welche gibt!
user795305

1
Puh, das ist viel Mathe! Die Frage erscheint mir viel konzeptioneller, ich werde sehen, ob ich die Zeit finde, eine Antwort in Worten hinzuzufügen.
Aaron verließ Stack Overflow

1
F.
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.