Ich gehe davon aus, dass eine "kategoriale" Variable tatsächlich für eine ordinale Variable steht. Andernfalls macht es wenig Sinn, es als kontinuierliche Variable zu behandeln, es sei denn, es handelt sich um eine binäre Variable (codiert mit 0/1), auf die @Rob zeigt. Dann würde ich sagen , dass das Problem nicht so sehr die Art und Weise wir die Variable behandeln, obwohl viele Modelle für kategorische Datenanalyse wurden bisher entwickelt worden - siehe zum Beispiel die Analyse der bestellten kategorische Daten: Eine Übersicht und eine Übersicht über den letzten Entwicklungen von Liu und Agresti-, als die zugrunde liegende Messskala wir annehmen. Meine Antwort wird sich auf diesen zweiten Punkt konzentrieren, obwohl ich zunächst kurz auf die Zuordnung numerischer Bewertungen zu variablen Kategorien oder Ebenen eingehen werde.
Wenn Sie eine einfache numerische Umcodierung einer Ordinalvariablen verwenden, nehmen Sie an, dass die Variable Intervalleigenschaften hat (im Sinne der von Stevens, 1946, angegebenen Klassifikation). Aus messtheoretischer Sicht (in der Psychologie) mag dies oft eine zu starke Annahme sein, aber für das Grundstudium (dh wenn ein einzelner Punkt verwendet wird, um seine Meinung zu einer täglichen Aktivität mit klarem Wortlaut auszudrücken) sollten alle monotonen Scores vergleichbare Ergebnisse liefern . Cochran (1954) hat darauf bereits hingewiesen
Jeder Satz von Bewertungen ergibt einen gültigen
Test, vorausgesetzt, dass sie ohne Rücksprache mit den Ergebnissen des Experiments erstellt wurden. Wenn die Anzahl der Bewertungen schlecht ist und eine der geordneten Klassifizierung zugrunde liegende numerische Skala dadurch stark verzerrt wird, ist der Test nicht empfindlich. Die Bewertungen sollten daher den bestmöglichen Einblick in die Art und Weise bieten, in der die Klassifizierung erstellt und verwendet wurde. (S. 436)
(Vielen Dank an @whuber, der mich in einem seiner Kommentare daran erinnert hat, weshalb ich Agrestis Buch, aus dem dieses Zitat stammt, erneut gelesen habe.)
M2M2= ( n - 1 ) r2
Sie können sich auch dafür entscheiden, Ihre Variable in einem unregelmäßigen Bereich neu zu codieren oder einige ihrer Ebenen zu aggregieren. In diesem Fall kann jedoch ein starkes Ungleichgewicht zwischen den neu codierten Kategorien statistische Tests verzerren, z. B. den oben genannten Trendtest. @Jeromy hat bereits eine gute Alternative für die Zuordnung des Abstands zwischen Kategorien vorgeschlagen, nämlich die optimale Skalierung.
Lassen Sie uns nun den zweiten Punkt diskutieren, den ich gemacht habe, nämlich den des zugrunde liegenden Messmodells. Ich zögere immer, das "Psychometrics" -Tag hinzuzufügen, wenn ich diese Art von Frage sehe, da die Konstruktion und Analyse von Messskalen unter die psychometrische Theorie fällt (Nunnally und Bernstein, 1994, für einen guten Überblick). Ich werde nicht auf alle Modelle eingehen, die unter der Item-Response-Theorie stehen , und ich verweise den interessierten Leser freundlich auf das Tutorial von I. Partchev, Eine visuelle Anleitung zur Item-Response-Theorie, für eine vorsichtige Einführung in das IRT und zu den am Ende aufgeführten Referenzen (5-8) für mögliche IRT-Taxonomien. Kurz gesagt: Anstatt willkürliche Abstände zwischen variablen Kategorien zuzuweisen, nehmen Sie eine latente Skala an und schätzen deren Position auf diesem Kontinuum zusammen mit den Fähigkeiten oder der Haftung des Einzelnen. Ein einfaches Beispiel ist viel mathematische Notation wert. Betrachten wir daher den folgenden Punkt (der aus dem gesundheitsbezogenen Fragebogen zur Lebensqualität von EORTC QLQ-C30 stammt ):
Hast du dir Sorgen gemacht?
die auf einer Vier-Punkte-Skala von "Überhaupt nicht" bis "Sehr viel" codiert ist. Die Rohwerte werden durch Zuweisen eines Wertes von 1 bis 4 berechnet. Die Werte für Elemente derselben Skala können dann zu einem sogenannten Skalenwert addiert werden, der den Rang eines Benutzers auf dem zugrunde liegenden Konstrukt (hier eine Komponente der psychischen Gesundheit) angibt ). Solche summierten Skalenwerte sind sehr praktisch, da sie für den Arzt oder die Krankenschwester leicht zu bewerten sind, aber sie sind nichts weiter als eine diskrete (geordnete) Skala.
Wir können auch davon ausgehen, dass die Wahrscheinlichkeit, eine bestimmte Antwortkategorie zu unterstützen, einer Art logistischem Modell entspricht, wie in I. Partchevs oben beschriebenem Tutorial beschrieben. Grundsätzlich geht es um eine Art Schwellenwertmodell (das zu einer äquivalenten Formulierung in Form von proportionalen oder kumulativen Quotenmodellen führt), und wir modellieren die Wahrscheinlichkeit, in einer Antwortkategorie zu sein, eher als die vorherige oder die Wahrscheinlichkeit, über a zu punkten bestimmte Kategorie, abhängig von der Position der Probanden auf dem latenten Merkmal. Darüber hinaus können wir festlegen, dass die Antwortkategorien auf der latenten Skala gleich verteilt sind (dies ist das Bewertungsskalenmodell) - wie wir es tun, indem wir regelmäßig verteilte numerische Bewertungen zuweisen - oder nicht (dies ist das Teilkreditmodell). .
Es ist klar, dass wir der klassischen Testtheorie, bei der Ordinalvariablen als numerische Variablen behandelt werden, nicht viel hinzufügen. Wir führen jedoch ein Wahrscheinlichkeitsmodell ein, bei dem wir eine kontinuierliche Skala (mit Intervalleigenschaften) annehmen und bei dem bestimmte Messfehler berücksichtigt werden können, und wir können diese Fakultätsbewertungen in jedes Regressionsmodell einbinden.
Verweise
- SS Stevens. Zur Theorie der Maßstäbe. Science , 103 : 677 & ndash; 680, 1946.
- χ2
- J Nunnally und ich Bernstein. Psychometrische Theorie . McGraw-Hill, 1994
- Alan Agresti. Kategoriale Datenanalyse . Wiley, 1990.
- CR Rao und S Sinharay, Herausgeber. Handbuch der Statistik, Bd. 26: Psychometrie . Elsevier Science BV, Niederlande, 2007.
- Ein Boomsma, MAJ van Duijn und TAB Snijders. Aufsätze zur Item Response Theorie . Springer, 2001.
- D Thissen und L Steinberg. Eine Taxonomie von Item-Response-Modellen. Psychometrika , 51 (4) : 567–577, 1986.
- P Mair und R Hatzinger. Erweiterte Rasch Modellierung: Das ERM - Paket für die Anwendung von IRT - Modelle in R . Journal of Statistical Software , 20 (9) , 2007.