Wenn jeder einzelne Punkt des Fragebogens eine Ordnungszahl ist und ich glaube nicht, dass dieser Punkt bestritten werden kann, wenn man bedenkt, dass es keine Möglichkeit gibt, festzustellen, ob der quantitative Unterschied zwischen "stark zustimmen" und "zustimmen" der gleiche ist wie der zwischen " stimme überhaupt nicht zu "und" stimme überhaupt nicht zu ", warum sollte dann die Summierung all dieser Ordnungsstufenskalen einen Wert ergeben, der die Eigenschaften von Daten auf wahrer Intervallebene teilt?
Wenn wir zum Beispiel die Ergebnisse eines Depressionsinventars interpretieren, ist es (zumindest für mich) nicht sinnvoll zu sagen, dass eine Person mit einer Punktzahl von "20" doppelt so depressiv ist wie eine Person mit einer Punktzahl von "20". 10 ". Dies liegt daran, dass jeder Punkt im Fragebogen nicht die tatsächlichen Unterschiede im Ausmaß der Depression misst (unter der Annahme, dass die Depression eine stabile, intenale, organische Störung ist), sondern die subjektive Bewertung der Übereinstimmung der Person mit einer bestimmten Aussage. Auf die Frage "Wie deprimiert ist Ihre Stimmung auf einer Skala von 1 bis 4? 1 ist sehr deprimiert und 4 ist überhaupt nicht deprimiert." Weiß ich, dass die subjektive Bewertung 1 eines Befragten mit der eines anderen Befragten identisch ist ? Oder wie kann ich wissen, ob der Unterschied zwischen 4 und 3 in Bezug auf die Person gleich dem von 3 und 4 ist? Wenn wir nichts davon wissen, ist es nicht sinnvoll, die Summe aller dieser Ordnungszahlen als Intervalldaten zu behandeln. Selbst wenn die Daten eine Normalverteilung bilden, halte ich es nicht für angebracht, die Unterschiede zwischen den Bewertungen als Intervalldaten zu behandeln, wenn sie durch Addition aller Antworten auf ein Likert-Item berechnet wurden. Eine normale Datenverteilung bedeutet lediglich, dass die Antworten wahrscheinlich repräsentativ für die größere Bevölkerung sind. Dies bedeutet nicht, dass die aus den Inventaren erhaltenen Werte wichtige Eigenschaften der Intervalldaten gemeinsam haben. Ich halte es nicht für angebracht, die Unterschiede zwischen den Bewertungen als Intervalldaten zu behandeln, wenn sie berechnet wurden, indem alle Antworten zu einem Likert-Item addiert wurden. Eine normale Datenverteilung bedeutet lediglich, dass die Antworten wahrscheinlich repräsentativ für die größere Bevölkerung sind. Dies bedeutet nicht, dass die aus den Inventaren erhaltenen Werte wichtige Eigenschaften der Intervalldaten gemeinsam haben. Ich halte es nicht für angebracht, die Unterschiede zwischen den Bewertungen als Intervalldaten zu behandeln, wenn sie berechnet wurden, indem alle Antworten zu einem Likert-Item addiert wurden. Eine normale Datenverteilung bedeutet lediglich, dass die Antworten wahrscheinlich repräsentativ für die größere Bevölkerung sind. Dies bedeutet nicht, dass die aus den Inventaren erhaltenen Werte wichtige Eigenschaften der Intervalldaten gemeinsam haben.
Wir müssen in den Verhaltenswissenschaften vorsichtig sein, wie wir Statistiken verwenden, um mit den latenten Variablen, die wir untersuchen, zu sprechen, denn da es keinen direkten Weg gibt, diese hypothetischen Konstrukte zu messen, gibt es erhebliche Probleme, wenn wir versuchen, sie zu quantifizieren zu parametrischen Tests. Auch dies bedeutet nicht, dass Unterschiede zwischen diesen Werten bedeutsam sind, nur weil wir einer Reihe von Antworten Werte zugewiesen haben.