Kurtosis misst Ausreißer. Ausreißer sind problematisch für die Standardinferenzen (z. B. t-Tests, t-Intervalle), die auf der Normalverteilung basieren. Das ist das Ende der Geschichte! Und es ist wirklich eine ziemlich einfache Geschichte.
Der Grund, warum diese Geschichte nicht sehr geschätzt wird, ist, dass der uralte Mythos, dass Kurtosis "Peakedness" misst, weiterhin besteht.
Hier ist eine einfache Erklärung, warum Kurtosis Ausreißer und nicht "Peakedness" misst.
Betrachten Sie den folgenden Datensatz.
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1
Kurtosis ist der erwartete Wert der (z-Werte) ^ 4. Hier sind die (z-Werte) ^ 4:
6,51, 0,30, 5,33, 0,45, 0,00, 0,30, 6,51, 0,00, 0,45, 0,30, 0,00, 6,51, 0,00, 0,30, 0,00, 27,90, 0,00, 0,30, 0,45
Der Durchschnitt liegt bei 2,78, und das ist eine Schätzung der Kurtosis. (Subtrahieren Sie 3, wenn Sie übermäßige Kurtosis wünschen.)
Ersetzen Sie nun den letzten Datenwert durch 999, damit er zu einem Ausreißer wird:
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999
Hier sind die (z-Werte) ^ 4:
0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 360,98
Der Durchschnitt liegt bei 18,05, und das ist eine Schätzung der Kurtosis. (Subtrahieren Sie 3, wenn Sie übermäßige Kurtosis wünschen.)
Es ist klar, dass nur die Ausreißer eine Rolle spielen. Nichts über den "Peak" oder die Daten in der Nähe der Mitte ist von Bedeutung.
Wenn Sie statistische Standardanalysen mit dem zweiten Datensatz durchführen, sollten Sie mit Problemen rechnen. Die große Kurtosis macht Sie auf das Problem aufmerksam.
Hier ist ein Papier, das ausgearbeitet wird:
Westfall, PH (2014). Kurtosis as Peakedness, 1905 - 2014. RIP The American Statistician, 68, 191–195.