Wie bei anderen parametrischen Tests wird bei der Varianzanalyse davon ausgegangen, dass die Daten zur Normalverteilung passen. Wenn Ihre Messgröße nicht normal verteilt ist, können Sie die Wahrscheinlichkeit eines falsch positiven Ergebnisses erhöhen, wenn Sie die Daten mit einer Anova oder einem anderen Test analysieren, der von Normalität ausgeht. Glücklicherweise reagiert eine Anova nicht sehr empfindlich auf mäßige Abweichungen von der Normalität. Simulationsstudien unter Verwendung verschiedener nicht normaler Verteilungen haben gezeigt, dass die falsch-positive Rate durch diese Verletzung der Annahme nicht sehr stark beeinflusst wird (Glass et al. 1972, Harwell et al. 1992, Lix et al. 1996). Dies liegt daran, dass bei einer großen Anzahl von Zufallsstichproben aus einer Grundgesamtheit die Mittelwerte dieser Stichproben auch dann ungefähr normal verteilt sind, wenn die Grundgesamtheit nicht normal ist.
Es ist möglich, die Anpassungsgüte eines Datensatzes an die Normalverteilung zu testen. Ich schlage nicht vor, dass Sie dies tun, da viele Datensätze, die signifikant nicht normal sind, für eine Anova perfekt geeignet wären.
Wenn Sie stattdessen über einen ausreichend großen Datensatz verfügen, sollten Sie sich nur das Frequenzhistogramm ansehen. Wenn es mehr oder weniger normal aussieht, führen Sie eine Anova durch. Wenn es aussieht wie eine Normalverteilung, die auf eine Seite verschoben wurde, wie die Sulfatdaten oben, sollten Sie verschiedene Datentransformationen ausprobieren und prüfen, ob eines davon das Histogramm normaler erscheinen lässt. Wenn das nicht funktioniert und die Daten immer noch sehr ungewöhnlich aussehen, ist es wahrscheinlich immer noch in Ordnung, die Daten mit einer Anova zu analysieren. Möglicherweise möchten Sie es jedoch mit einem nicht parametrischen Test analysieren. Nahezu jeder parametrische statistische Test hat einen nicht-parametrischen Ersatz wie den Kruskal-Wallis-Test anstelle einer Einweganova, den Wilcoxon-Signed-Rank-Test anstelle eines gepaarten t-Tests und die Spearman-Rank-Korrelation anstelle einer linearen Regression. Bei diesen nicht parametrischen Tests wird nicht davon ausgegangen, dass die Daten zur Normalverteilung passen. Sie gehen jedoch davon aus, dass die Daten in verschiedenen Gruppen die gleiche Verteilung aufweisen. Wenn verschiedene Gruppen unterschiedlich geformte Verteilungen haben (z. B. eine nach links und eine nach rechts), ist ein nicht parametrischer Test möglicherweise nicht besser als ein parametrischer Test.
Verweise
- Glass, GV, PD Peckham und JR Sanders. 1972. Konsequenzen der Nichterfüllung der Annahmen, die den Festeffektanalysen von Varianz und Kovarianz zugrunde liegen. Rev. Educ. Res. 42: 237 & ndash; 288.
- Harwell, MR, EN Rubinstein, WS Hayes und CC Olds. 1992. Das Zusammenfassen von Monte Carlo führt zu methodischen Untersuchungen: Die ANOVA-Fälle mit Ein-Faktor- und Zweifaktor-Fixeffekten. J. Educ. Stat. 17: 315 & ndash; 339.
- Lix, LM, JC Keselman und HJ Keselman. 1996. Folgen von erneuten Annahmenverletzungen: Eine quantitative Überprüfung von Alternativen zur Einweganalyse des Varianz-F-Tests. Rev. Educ. Res. 66: 579 & ndash; 619.