Versuchen Sie, die Normalität mit einem rationalen Urteil zu beurteilen, anstatt sich auf einen Test für die Normalität der Residuen zu verlassen. Normalitätstests sagen Ihnen nicht, dass Ihre Daten normal sind, nur, dass dies nicht der Fall ist. Da es sich bei den Daten jedoch um Stichproben handelt, können Sie sicher sein, dass sie ohne einen Test nicht normal sind. Die Anforderung ist ungefähr normal. Der Test kann Ihnen das nicht sagen. Tests werden auch bei großen N sehr empfindlich oder schwerwiegender, variieren in der Empfindlichkeit mit N. Ihr N liegt in dem Bereich, in dem die Empfindlichkeit beginnt, hoch zu werden. Wenn Sie die folgende Simulation in R mehrmals ausführen und die Diagramme betrachten, werden Sie feststellen, dass der Normalitätstest bei einer guten Anzahl von Normalverteilungen "nicht normal" lautet.
# set the plot area to show two plots side by side (make the window wide)
par(mfrow = c(1, 2))
n <- 158 # use the N we're concerned about
# Run this a few times to get an idea of what data from a
# normal distribution should look like.
# especially note how variable the histograms look
y <- rnorm(n) # n numbers from normal distribution
# view the distribution
hist(y)
qqnorm(y);qqline(y)
# run this section several times to get an idea what data from a normal
# distribution that fails the normality test looks like
# the following code block generates random normal distributions until one
# fails a normality test
p <- 1 # set p to a dummy value to start with
while(p >= 0.05) {
y <- rnorm(n)
p <- shapiro.test(y)$p.value }
# view the distribution that failed
hist(y)
qqnorm(y);qqline(y)
Hoffentlich können Sie nach Durchlaufen der Simulationen feststellen, dass ein Normalitätstest ziemlich normal aussehende Daten leicht ablehnen kann und dass Daten aus einer Normalverteilung weit vom Normalen abweichen können. Wenn Sie einen extremen Wert von diesem Versuch sehen möchten n <- 1000
. Die Verteilungen sehen alle normal aus, bestehen den Test jedoch immer noch mit ungefähr der gleichen Rate wie niedrigere N-Werte. Und umgekehrt kann der Test mit einer niedrigen N-Verteilung, die den Test besteht, weit vom Normalen abweichen.
Das Standard-Residuendiagramm in SPSS ist für die Beurteilung der Normalität nicht besonders nützlich. Sie können Ausreißer, die Reichweite, die Passgenauigkeit und vielleicht sogar die Hebelwirkung sehen. Aber es ist schwierig, daraus Normalität abzuleiten. Probieren Sie die folgende Simulation aus, um Histogramme, Quantil-Quantil-Normal-Diagramme und Residuendiagramme zu vergleichen.
par(mfrow = c(1, 3)) # making 3 graphs in a row now
y <- rnorm(n)
hist(y)
qqnorm(y); qqline(y)
plot(y); abline(h = 0)
Es ist außerordentlich schwierig, die Normalität oder vieles davon von der letzten Handlung zu unterscheiden, und daher keine schreckliche Diagnose der Normalität.
Zusammenfassend wird allgemein empfohlen, sich nicht auf Normalitätstests zu stützen, sondern auf diagnostische Diagramme der Residuen. Ohne diese Diagramme oder die tatsächlichen Werte in Ihrer Frage ist es sehr schwierig, Ihnen fundierte Ratschläge zu geben, was Ihre Daten in Bezug auf Analyse oder Transformation benötigen. Geben Sie die Rohdaten ein, um die bestmögliche Hilfe zu erhalten.