Sie sind auf dem richtigen Weg, aber sehen Sie immer in der Dokumentation der von Ihnen verwendeten Software nach, welches Modell tatsächlich passt. Es sei eine Situation mit einer kategorial abhängigen Variablen Y. mit geordneten Kategorien 1 , … , g, … , K und Prädiktoren X1, … , Xj, … , Xp .
"In the wild" gibt es drei gleichwertige Möglichkeiten, um das theoretische Proportional-Odds-Modell mit verschiedenen implizierten Parameterbedeutungen zu schreiben:
- logit ( p ( Y⩽ g) ) = lnp ( Y⩽ g)p ( Y> g)= β0G+ β1X1+ ⋯ + βpXp( g= 1 , … , k - 1 )
- logit ( p ( Y⩽ g) ) = lnp ( Y⩽ g)p ( Y> g)= β0G- ( β1X1+ ⋯ + βpXp)( g= 1 , … , k - 1 )
- logit ( p ( Y⩾ g) ) = lnp ( Y⩾ g)p ( Y< g)= β0G+ β1X1+ ⋯ + βpXp( g= 2 , … , k )
(Modelle 1 und 2 haben die Einschränkung, dass in den separaten binären logistischen Regressionen die nicht mit variieren und , Modell 3 hat die gleiche Einschränkung für und erfordert, dass )β j g β 0 1 < … < β 0 g < … < β 0 k - 1 β j β 0 2 > … > β 0 g > … > β 0 kk - 1βjGβ01< … < Β0G< … < Β0k- 1βjβ02> … > Β0G> … > Β0k
- In Modell 1 bedeutet ein positives , dass eine Erhöhung des Prädiktors mit einer erhöhten Wahrscheinlichkeit für eine niedrigere Kategorie in . X j YβjXjY.
- Modell 1 ist etwas eingängig, daher scheinen Modell 2 oder 3 das bevorzugte Modell in der Software zu sein. Hier bedeutet ein positives , dass eine Erhöhung des Prädiktors mit einer erhöhten Wahrscheinlichkeit für eine höhere Kategorie in . X j YβjXjY.
- Die Modelle 1 und 2 führen zu denselben Schätzungen für , aber ihre Schätzungen für haben entgegengesetzte Vorzeichen. β jβ0Gβj
- Die Modelle 2 und 3 führen zu denselben Schätzungen für , aber ihre Schätzungen für haben entgegengesetzte Vorzeichen. β 0 gβjβ0G
Unter der Annahme, dass Ihre Software Modell 2 oder 3 verwendet, können Sie bei einer Steigerung von 1 Einheit ceteris paribus die vorhergesagten Wahrscheinlichkeiten für die Beobachtung von ' ' im Vergleich zur Beobachtung von ' ' sagen 'Änderung um einen Faktor von . ", und ebenfalls" mit einer 1- Zunahme von , ceteris paribus, die vorhergesagte Wahrscheinlichkeit,' 'vs. Beobachten einer Änderung von ' 'um den Faktor . " Beachten Sie, dass wir im empirischen Fall nur die vorhergesagten Quoten haben, nicht die tatsächlichen. Y = Gut Y = Nullorbad e β 1 = 0,607 X 1 Y = gut oder Neutral Y = Bad e β 1 = 0,607X1Y.= GutY.= Neutral ODER Schlechteβ^1=0.607X1Y=Good OR NeutralY=Badeβ^1=0.607
Hier einige zusätzliche Abbildungen für Modell 1 mit Kategorien. Erstens die Annahme eines linearen Modells für die kumulativen Logs mit proportionalen Quoten. Zweitens die impliziten Wahrscheinlichkeiten, höchstens Kategorie . Die Wahrscheinlichkeiten folgen logistischen Funktionen mit der gleichen Form.
gk=4G
Für die Kategoriewahrscheinlichkeiten selbst impliziert das dargestellte Modell die folgenden geordneten Funktionen:
PS Meines Wissens wird Modell 2 in SPSS sowie in R-Funktionen MASS::polr()
und verwendet ordinal::clm()
. Modell 3 wird in R-Funktionen rms::lrm()
und verwendet VGAM::vglm()
. Leider kenne ich SAS und Stata nicht.