Meine Hauptfrage ist, wie die Ausgabe (Koeffizienten, F, P) bei der Durchführung einer (sequentiellen) ANOVA vom Typ I zu interpretieren ist.
Mein spezielles Forschungsproblem ist etwas komplexer, deshalb werde ich mein Beispiel in Teile zerlegen. Wenn ich mich zuerst für die Auswirkung der Spinnendichte (X1) auf das Pflanzenwachstum (Y1) interessiere und Setzlinge in Gehege pflanzte und die Spinnendichte manipulierte, kann ich die Daten mit einer einfachen ANOVA oder linearen Regression analysieren. Dann wäre es egal, ob ich für meine ANOVA die Quadratsumme (SS) Typ I, II oder III verwendet hätte. In meinem Fall habe ich 4 Wiederholungen von 5 Dichtestufen, sodass ich die Dichte als Faktor oder als stetige Variable verwenden kann. In diesem Fall ziehe ich es vor, es als kontinuierliche unabhängige (Prädiktor-) Variable zu interpretieren. In RI könnte Folgendes ausgeführt werden:
lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)
Das Ausführen der Anova-Funktion ist hoffentlich zu einem späteren Zeitpunkt für einen Vergleich sinnvoll. Die Ausgabe ist:
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4279 0.08058 .
Residuals 18 2.53920 0.14107
Nehmen wir an, ich vermute, dass der Anfangsgehalt an anorganischem Stickstoff im Boden, den ich nicht kontrollieren konnte, auch das Pflanzenwachstum erheblich beeinflusst hat. Ich bin nicht besonders an diesem Effekt interessiert, möchte aber möglicherweise die dadurch verursachten Schwankungen berücksichtigen. Wirklich, mein Hauptinteresse gilt den Auswirkungen der Spinnendichte (Hypothese: Erhöhte Spinnendichte führt zu erhöhtem Pflanzenwachstum - vermutlich durch Reduzierung pflanzenfressender Insekten, aber ich teste nur den Effekt, nicht den Mechanismus). Ich könnte die Wirkung von anorganischem N zu meiner Analyse hinzufügen.
Nehmen wir für meine Frage an, ich teste die Wechselwirkungsdichte * anorganischN und sie ist nicht signifikant, also entferne ich sie aus der Analyse und führe die folgenden Haupteffekte aus:
> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4113 0.08223 .
inorganicN 1 0.12936 0.12936 0.9126 0.35282
Residuals 17 2.40983 0.14175
Jetzt macht es einen Unterschied, ob ich SS vom Typ I oder Typ II verwende (ich weiß, dass einige Leute die Begriffe Typ I und II ablehnen, aber angesichts der Beliebtheit von SAS ist es einfach, sich kurz zu fassen). R anova {stats} verwendet standardmäßig Typ I. Ich kann die Dichte von Typ II SS, F und P durch Umkehren der Reihenfolge meiner Haupteffekte berechnen oder das "Auto" -Paket von Dr. John Fox (Begleiter der angewandten Regression) verwenden. Ich bevorzuge die letztere Methode, da es bei komplexeren Problemen einfacher ist.
library(car)
Anova(lm2)
Sum Sq Df F value Pr(>F)
density 0.58425 1 4.1216 0.05829 .
inorganicN 0.12936 1 0.9126 0.35282
Residuals 2.40983 17
Mein Verständnis ist, dass Hypothesen vom Typ II lauten würden: "Es gibt keine lineare Auswirkung von x1 auf y1, wenn man die Auswirkung von (Konstante halten?) X2 annimmt" und dasselbe für x2, wenn man x1 annimmt. Ich denke, hier bin ich verwirrt. Welche Hypothese wird von der ANOVA mit der oben beschriebenen (sequentiellen) Methode vom Typ I im Vergleich zur Hypothese mit der Methode vom Typ II getestet?
In Wirklichkeit sind meine Daten etwas komplexer, da ich zahlreiche Messgrößen für das Pflanzenwachstum sowie die Nährstoffdynamik und die Streuzersetzung gemessen habe. Meine eigentliche Analyse ist so etwas wie:
Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)
Type II MANOVA Tests: Pillai test statistic
Df test stat approx F num Df den Df Pr(>F)
density 1 0.34397 1 5 12 0.34269
nitrate 1 0.99994 40337 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)
Df Pillai approx F num Df den Df Pr(>F)
density 1 0.99950 4762 5 12 < 2e-16 ***
nitrate 1 0.99995 46248 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
Residuals 16