Eine kurze Antwort ist, dass dies umstritten ist. Entgegen dem von Ihnen angesprochenen Rat nehmen Menschen in vielen Bereichen Mittelwerte und sind oft froh, dass sie das tun, was sie wollen. Ein Beispiel sind Notendurchschnitte oder ähnliche Werte in vielen Bildungssystemen.
Ordnungsdaten, die nicht normal verteilt sind, sind jedoch kein gültiger Grund, da dies der Mittelwert ist
weit verbreitet für nicht normale Distributionen
mathematisch gut definiert für sehr viele nicht normale Verteilungen, außer in einigen pathologischen Fällen.
Es ist möglicherweise keine gute Idee, den Mittelwert in der Praxis zu verwenden, wenn Daten definitiv nicht normal verteilt sind, aber das ist anders.
Ein stärkerer Grund, den Mittelwert nicht mit Ordnungsdaten zu verwenden, besteht darin, dass sein Wert von den Kodierungskonventionen abhängt. Numerische Codes wie 1, 2, 3, 4 werden normalerweise nur aus Gründen der Einfachheit oder Bequemlichkeit gewählt, aber im Prinzip könnten sie genauso gut 1, 23, 456, 7890 sein, soweit dies einer bestimmten Reihenfolge entspricht. Den Mittelwert zu nehmen würde in beiden Fällen bedeuten, diese Konventionen wörtlich zu nehmen (als ob die Zahlen nicht willkürlich, sondern gerechtfertigt wären), und es gibt keinen strengen Grund, dies zu tun. Sie benötigen eine Intervallskala, in der gleiche Differenzen zwischen Werten wörtlich genommen werden können, um die Verwendung von Mitteln zu rechtfertigen. Das nehme ich als Hauptargument an, aber wie bereits angedeutet, ignorieren die Leute es oft und absichtlich, weil sie Mittel nützlich finden, was auch immer Messtheoretiker sagen.
Hier ist ein extra Beispiel. Oft werden die Leute gebeten, eines von "stimme überhaupt nicht zu" zu wählen ... "stimme voll zu" und (abhängig davon, was die Software will) die Forscher als 1 .. 5 oder 0 .. 4 oder was auch immer sie wollen, zu kodieren oder zu deklarieren als geordneter Faktor (oder welcher Begriff auch immer von der Software verwendet wird). Hier ist die Codierung willkürlich und für die Personen, die die Frage beantworten, nicht sichtbar.
Aber oft werden auch Leute auf einer Skala von 1 bis 5 gefragt (sagen wir mal), wie bewerten Sie etwas? Beispiele gibt es zuhauf: Websites, Sport, andere Arten von Wettbewerben und in der Tat Bildung. Hier wird den Menschen eine Waage gezeigt und gebeten, diese zu benutzen. Es ist allgemein bekannt, dass Nicht-Ganzzahlen sinnvoll sind, aber Sie dürfen nur Ganzzahlen als Konvention verwenden. Ist diese Ordnungsskala? Manche sagen ja, manche sagen nein. Andernfalls besteht ein Teil des Problems darin, dass die Ordnungsskala selbst ein unscharfer oder umstrittener Bereich ist.
Betrachten Sie noch einmal Noten für akademische Arbeiten, sagen Sie E bis A. Oft werden solche Noten auch numerisch behandelt, sagen Sie 1 bis 5, und die Leute berechnen routinemäßig Durchschnittswerte für Schüler, Kurse, Schulen usw. und führen weitere Analysen solcher Daten durch. Zwar ist jede Zuordnung zu numerischen Bewertungen zwar willkürlich, aber akzeptabel, solange die Reihenfolge erhalten bleibt. In der Praxis wissen diejenigen, die die Noten vergeben und erhalten, dass die Noten numerische Äquivalente haben und dass die Noten gemittelt werden .
Ein pragmatischer Grund für die Verwendung von Mitteln ist, dass Mediane und Modi häufig schlechte Zusammenfassungen der Informationen in den Daten sind. Angenommen, Sie haben eine Skala, die stark von Uneinigkeit abweicht, um die Punkte 1 bis 5 eindeutig zu stimmen, und der Einfachheit halber codieren Sie diese Punkte Ihre Hände, wenn Sie der Meinung sind, dass der Median und der Modus die einzigen gerechtfertigten Zusammenfassungen sind, da es sich um eine Ordnungsskala handelt. Heben Sie jetzt Ihre Hände, wenn Sie den Mittelwert ebenfalls nützlich finden, unabhängig davon, ob die Summen gut definiert sind usw.
Natürlich wäre der Mittelwert eine hypersensitive Zusammenfassung, wenn die Codes beispielsweise die Quadrate oder Würfel von 1 bis 5 wären, und das ist möglicherweise nicht das, was Sie wollen. (Wenn Sie Überflieger schnell identifizieren möchten, ist dies möglicherweise genau das, was Sie möchten!) Genau deshalb ist die konventionelle Codierung mit aufeinanderfolgenden Ganzzahlcodes eine praktische Wahl, da sie in der Praxis häufig recht gut funktioniert. Dies ist kein Argument, das für Messtheoretiker von Belang ist oder sein sollte, aber Datenanalysten sollten daran interessiert sein, informationsreiche Zusammenfassungen zu erstellen.
Ich stimme jedem zu, der sagt: Nutze die gesamte Verteilung der Klassenhäufigkeiten, aber darum geht es nicht.