Wenn Sie eine Einweg-ANOVA durchführen, um zu testen, ob zwischen den Gruppen ein signifikanter Unterschied besteht, vergleichen Sie implizit zwei verschachtelte Modelle (es gibt also nur eine Verschachtelungsebene, aber es wird immer noch verschachtelt).
Diese beiden Modelle sind:
- yi jichjβ^0
yi j= β^0+ ϵich
Modell 1: Die Werte werden anhand der geschätzten Mittelwerte der Gruppen modelliert.
βj^
yich= β^0+ β^j+ ϵich
Ein Beispiel für den Vergleich von Mittelwerten und Äquivalenz mit verschachtelten Modellen: Nehmen wir die Kelchblattlänge (cm) aus dem Irisdatensatz (wenn wir alle vier Variablen verwenden, könnten wir tatsächlich LDA oder MANOVA durchführen, wie es Fisher 1936 getan hat).
Die beobachteten Gesamt- und Gruppenmittelwerte sind:
μtotalμsetosaμversicolorμvirginica=5.83=5.01=5.94=6.59
Welches ist in Modellform:
model 1: model 2: yij=5.83+ϵiyij=5.01+⎡⎣⎢00.931.58⎤⎦⎥j+ϵi
∑ϵ2i=102.1683
∑ϵ2i=38.9562
Und die ANOVA-Tabelle wird wie folgt aussehen (und implizit die Differenz zwischen der Gruppensumme der Quadrate berechnen, die die 63.212 in der Tabelle mit 2 Freiheitsgraden ist):
> model1 <- lm(Sepal.Length ~ 1 + Species, data=iris)
> model0 <- lm(Sepal.Length ~ 1, data=iris)
> anova(model0, model1)
Analysis of Variance Table
Model 1: Sepal.Length ~ 1
Model 2: Sepal.Length ~ 1 + Species
Res.Df RSS Df Sum of Sq F Pr(>F)
1 149 102.168
2 147 38.956 2 63.212 119.26 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
F=RSSdiffe r e n c eD F.di ffe r e n c eR S.S.n e wD F.n e w= 63,212238,956147= 119,26
im Beispiel verwendeter Datensatz:
Blütenblattlänge (cm) für drei verschiedene Arten von Irisblüten
Iris setosa Iris versicolor Iris virginica
5.1 7.0 6.3
4.9 6.4 5.8
4.7 6.9 7.1
4.6 5.5 6.3
5.0 6.5 6.5
5.4 5.7 7.6
4.6 6.3 4.9
5.0 4.9 7.3
4.4 6.6 6.7
4.9 5.2 7.2
5.4 5.0 6.5
4.8 5.9 6.4
4.8 6.0 6.8
4.3 6.1 5.7
5.8 5.6 5.8
5.7 6.7 6.4
5.4 5.6 6.5
5.1 5.8 7.7
5.7 6.2 7.7
5.1 5.6 6.0
5.4 5.9 6.9
5.1 6.1 5.6
4.6 6.3 7.7
5.1 6.1 6.3
4.8 6.4 6.7
5.0 6.6 7.2
5.0 6.8 6.2
5.2 6.7 6.1
5.2 6.0 6.4
4.7 5.7 7.2
4.8 5.5 7.4
5.4 5.5 7.9
5.2 5.8 6.4
5.5 6.0 6.3
4.9 5.4 6.1
5.0 6.0 7.7
5.5 6.7 6.3
4.9 6.3 6.4
4.4 5.6 6.0
5.1 5.5 6.9
5.0 5.5 6.7
4.5 6.1 6.9
4.4 5.8 5.8
5.0 5.0 6.8
5.1 5.6 6.7
4.8 5.7 6.7
5.1 5.7 6.3
4.6 6.2 6.5
5.3 5.1 6.2
5.0 5.7 5.9
anova()Funktion implementiert , da die erste echte ANOVA auch einen F-Test verwendet. Dies führt zu Terminologieverwirrung.