Häufig wird in einführenden Texten zur angewandten Statistik der Mittelwert vom Median unterschieden (häufig im Kontext der deskriptiven Statistik und zur Begründung der Zusammenfassung der zentralen Tendenz anhand von Mittelwert, Median und Modus), indem erläutert wird, dass der Mittelwert für Ausreißer in Stichprobendaten empfindlich ist und / oder Dies wird als Begründung für die Behauptung verwendet, dass der Median vorzuziehen ist, wenn die Daten nicht symmetrisch sind.
Beispielsweise:
Das beste Maß für die zentrale Tendenz für einen bestimmten Datensatz hängt häufig von der Art der Verteilung der Werte ab. Wenn die Daten nicht symmetrisch sind, ist der Median oft das beste Maß für die zentrale Tendenz. Da der Mittelwert für extreme Beobachtungen empfindlich ist, wird er in Richtung der äußeren Datenwerte gezogen und kann infolgedessen übermäßig aufgeblasen oder übermäßig entleert werden. "-
Pagano and Gauvreau, (2000) Principles of Biostatistics , 2nd ed. (P & G waren zur Hand, übrigens, sie nicht per se herausgreifen .)
Die Autoren definieren "zentrale Tendenz" folgendermaßen: "Das am häufigsten untersuchte Merkmal eines Datensatzes ist sein Zentrum oder der Punkt, über den sich Beobachtungen häufen."
Dies scheint mir eine weniger als eindeutige Art zu sein, nur den Median zu verwenden , da es das Gleiche ist, nur den Mittelwert zu verwenden, wenn die Daten / Verteilungen symmetrisch sind, als wenn man sagt, nur den Mittelwert zu verwenden, wenn er dem Median entspricht. Edit: whuber weist zu Recht darauf hin, dass ich robuste Maße der zentralen Tendenz mit dem Median verschmelze. Daher ist es wichtig zu bedenken, dass ich in der einführenden angewandten Statistik die spezifische Bestimmung des arithmetischen Mittels gegenüber dem Median diskutiere (wobei, abgesehen von der Art, andere Maße der zentralen Tendenz nicht motiviert sind).
Sollten wir diese nicht einfach als zwei verschiedene Maßstäbe der Zentralität verstehen, anstatt den Nutzen des Mittelwerts danach zu beurteilen, wie sehr er vom Verhalten des Medians abweicht? Mit anderen Worten, es ist ein Merkmal des Mittelwerts, empfindlich auf Schräglage zu reagieren. Man könnte genauso gut argumentieren: "Nun, der Median ist nicht gut, weil er weitgehend unempfindlich gegen Schräglauf ist. Verwenden Sie ihn also nur, wenn er dem Mittelwert entspricht."
(Der Modus beschäftigt sich vernünftigerweise nicht mit dieser Frage.)