Für einen bestimmten Datensatz wird der Spread häufig entweder als Standardabweichung oder als IQR (Interquartilbereich) berechnet.
Während a standard deviation
normalisiert ist (z-Scores usw.) und somit zum Vergleich der Streuung aus zwei verschiedenen Populationen verwendet werden kann, ist dies beim IQR nicht der Fall, da die Stichproben aus zwei verschiedenen Populationen Werte in zwei sehr unterschiedlichen Maßstäben haben könnten.
e.g.
Pop A: 100, 67, 89, 75, 120, ...
Pop B: 19, 22, 43, 8, 12, ...
Was ich anstrebe, ist eine robuste (nicht parametrische) Messgröße, mit der ich die Variation innerhalb verschiedener Populationen vergleichen kann.
Wahl 1:
IQR / Median
- Dies wäre analog zum Variationskoeffizienten , dh zu .
Wahl 2:
Range / IQR
Frage: Welches ist das aussagekräftigere Maß für den Vergleich von Variationen zwischen Populationen? Und wenn es Wahl 1 ist, ist Wahl 2 für irgendetwas nützlich / sinnvoll, oder ist es eine grundlegend fehlerhafte Maßnahme?