Abweichung von der Normalitätsannahme in der ANOVA: Ist Kurtosis oder Skewness wichtiger?

Angewandte lineare statistische Modelle von Kutner et al. In Bezug auf Abweichungen von der Normalitätsannahme von ANOVA-Modellen heißt es: Die Kurtosis der Fehlerverteilung (entweder mehr oder weniger als eine Normalverteilung) ist im Hinblick auf die Auswirkungen auf Schlussfolgerungen wichtiger als die Schiefe der Verteilung .

Ich bin ein bisschen verwirrt über diese Aussage und habe es nicht geschafft, verwandte Informationen zu finden, weder im Buch noch online. Ich bin verwirrt, weil ich auch erfahren habe, dass QQ-Diagramme mit starken Schwänzen ein Hinweis darauf sind, dass die Normalitätsannahme für lineare Regressionsmodelle "gut genug" ist, wohingegen verzerrte QQ-Diagramme eher von Belang sind (dh eine Transformation könnte angebracht sein). .

Stimmt es, dass die gleiche Überlegung für ANOVA gilt und dass ihre Wortwahl ( wichtiger im Hinblick auf die Auswirkungen auf Schlussfolgerungen ) nur schlecht gewählt wurde? Das heißt, eine verzerrte Verteilung hat schwerwiegendere Konsequenzen und sollte vermieden werden, wohingegen eine geringe Menge an Kurtosis akzeptabel sein kann.

EDIT: Wie von rolando2 angesprochen, ist es schwer zu sagen, dass einer in allen Fällen wichtiger ist als der andere, aber ich suche nur nach einer allgemeinen Einsicht. Mein Hauptproblem ist, dass mir beigebracht wurde, dass bei einer einfachen linearen Regression QQ-Diagramme mit schwereren Schwänzen (= Kurtosis?) In Ordnung sind, da der F-Test dagegen ziemlich robust ist. Andererseits sind verzerrte QQ-Diagramme (parabelförmig) normalerweise ein größeres Problem. Dies scheint direkt gegen die Richtlinien zu verstoßen, die mein Lehrbuch für ANOVA vorsieht, obwohl ANOVA-Modelle in Regressionsmodelle konvertiert werden können und die gleichen Annahmen haben sollten.

Ich bin überzeugt, dass ich etwas übersehen habe oder eine falsche Annahme habe, aber ich kann nicht herausfinden, was es sein könnte.

— Zenit
quelle

DeCarlo (1997) schlug in seiner Rezension zur Kurtosis genau das Gegenteil vor: Bei der ANOVA und anderen Tests auf Mittelgleichheit war der Versatz wichtiger. Vielleicht finden Sie die Zitate auf Seite 297 nützlich: columbia.edu/~ld208/psymeth97.pdf

— Anthony

Ich würde die Frage am produktivsten finden, wenn sie in einer Aussage wie "Schiefe ist für Schlussfolgerungen so viel wichtiger als Kurtosis" gelöst werden könnte, dass Schiefe auf der Ebene von ___ typischerweise die Ergebnisse ebenso verfälscht wie Kurtosis auf der Ebene von ___. . " Ohne eine solche Quantifizierung hilft es uns nicht viel, nur das eine oder andere zu sagen.

— Rolando2

Diese Simulation emis.de/journals/HOA/ADS/Volume7_4/206.pdf von Khan und Rayner (2003) im JOURNAL OF APPLIED MATHEMATICS AND DECISION SCIENCES besagt: "Sowohl der ANOVA- als auch der Kruskal-Wallis-Test sind erheblich stärker von der Kurtosis betroffen der Fehlerverteilung und nicht durch ihre Schiefe "(S. 204).

— bsbk

Eine äußerst eng verwandte Frage zum T-Test mit zwei Stichproben - im Grunde genommen eine Einweg-ANOVA mit zwei Stufen im Faktor - lautet stats.stackexchange.com/questions/38967/… ... Derzeit gibt es ein Kopfgeld für das Hinzufügen Verweise, da keine der vorhandenen Antworten Zitate enthält, sollten die Beantworter dieser Frage einen Blick darauf werfen.

— Silverfish

Ich stimme @ rolando2 zu: "Schiefe ist schlimmer als Kurtosis" oder umgekehrt ist eine ziemlich leere Aussage, ohne den Grad der Schiefe / Kurtosis zu erwähnen. Aber auch mehr muss beachtet werden! Zum Beispiel Robustheit gegenüber dieser Art von Verletzungen der Normalität hängt zum Teil von , ob die Gruppengrößen sind gleich , und Robustheit Schiefe auf der abhängig Richtung Schiefe - es ist noch schlimmer , wenn eine Gruppe ein schiefer ein Weg ist, und die andere Gruppe verzerrt die Gegenteiliger Weise, als wenn beide Gruppen in die gleiche Richtung verzerrt wären. (Dies ist aus dem Gedächtnis und erneuten Tests, aber das ist eine Art von ANOVA.)

— Silberfischchen

Antworten:

Die Schwierigkeit ist, dass Schiefe und Kurtosis abhängig sind; ihre Wirkungen können nicht vollständig voneinander getrennt werden.

Das Problem ist, dass Sie auch eine Verteilung mit hoher Kurtosis haben müssen , wenn Sie den Effekt einer Verteilung mit hohem Versatz untersuchen möchten .

$\geq$ $^2+1$

* (gewöhnliche skalierte Kurtosis im vierten Moment, nicht übermäßige Kurtosis)

Khan und Rayner (die in der vorherigen Antwort erwähnt wurden) arbeiten mit einer Familie zusammen, die eine Erforschung der Auswirkungen von Schiefe und Kurtosis ermöglicht, aber sie können dieses Problem nicht vermeiden, weshalb ihr Versuch, sie zu trennen, das Ausmaß der Wirkung von stark einschränkt Schiefe kann erkundet werden.

$\beta_2$ $\sqrt{\beta_2-1}$

Wenn Sie zum Beispiel den Effekt einer hohen Schiefe sehen möchten - sagen Sie Schiefe> 5 -, können Sie bei einer Kurtosis von weniger als 26 keine Verteilung erhalten!

Wenn Sie also die Auswirkungen einer hohen Schräglage untersuchen möchten, können Sie es nicht vermeiden, die Auswirkungen einer hohen Kurtosis zu untersuchen. Wenn Sie also versuchen, sie zu trennen, sind Sie in der Tat nicht in der Lage, den Effekt einer Erhöhung der Schiefe auf ein hohes Maß zu bewerten.

Zumindest für die Vertriebsfamilie, die sie in Betracht zogen, und innerhalb der Grenzen, die die Beziehung zwischen ihnen aufzeigt, scheinen die Untersuchungen von Khan und Rayner jedoch darauf hinzudeuten, dass Kurtosis das Hauptproblem ist.

$>\sqrt{2}$

— Glen_b - Setzen Sie Monica wieder ein
quelle

Dieses Problem wird von Khan und Rayner in "Robustheit gegenüber Nicht-Normalität von allgemeinen Tests für das Standortproblem mit vielen Stichproben" angesprochen .

Sie stellten fest, dass ANOVA-Tests wesentlich stärker von der Kurtosis als von der Schiefe betroffen sind und dass die Wirkung der Schiefe in keinem Zusammenhang mit ihrer Richtung steht.

Bei Verdacht auf Abweichungen von der Normalität ist der Kruskal-Wallis-Test möglicherweise die bessere Wahl. Kruskal-Wallis - Test ist robuster zu Abweichungen von der Normalität , weil es die Hypothese untersucht , dass die Behandlung Mediane identisch ist. ANOVA prüft die Hypothese , dass die Behandlungsmittel identisch sind.

— Brian Spiering
quelle

Bedeutet dies dann auch, dass ich QQ-Diagramme für lineare Regression und ANOVA anders interpretieren sollte? Bei den meisten Transformationen habe ich die Schiefe verringert, aber leicht schwere Schwänze (= Kurtosis?) Hinterlassen. Ich hatte den Eindruck, dass der F-Test robust genug war, um mit letzterem umzugehen, aber nicht mit ersteren. Oder ist das "schwere Schwänze sind OK" ein Missverständnis meinerseits? Ich kann mir nicht vorstellen, dass zwischen beiden ein so grundlegender Unterschied besteht, da ANOVA-Modelle auch als lineare Regressionsmodelle umgeschrieben werden können.

— Zenit