Entschuldigung, wenn dies eine sehr grundlegende Frage ist.
Wenn wir Daten haben, die nicht normal verteilt sind (z. B. verzerrt, Shapiro-Wilk-Test ist signifikant) und wir auf rangbasierte Methoden zurückgreifen (z. B. Wilcoxon Signed Rank-Test), müssen wir uns dann mit Ausreißern befassen?
Stellen Sie sich zum Beispiel vor, wir zeichnen die Daten mithilfe eines Boxplots und eine Minderheit der Datenpunkte wird als Ausreißer markiert. Sollten wir diese Punkte transformieren? Oder entfernen Sie sie? Es scheint mir, dass viele Lehrbücher über den Umgang mit Ausreißern sprechen, aber nur, weil sie einen großen Einfluss auf die Parameter wie Mittelwert und Standardabweichung haben. Wenn wir jedoch einen rangbasierten Test verwenden, werden sie bereits zum nächsten Wert im Rang "transformiert" und würden daher keinen wesentlichen Einfluss auf den Test ausüben. Ich habe dies bisher nicht explizit in einem Statistikbuch gesehen, daher dachte ich, ich würde die Frage hier stellen.
Müssen wir uns über Ausreißer Gedanken machen, wenn wir rangbasierte Tests verwenden?