Ich werde mich hauptsächlich auf Ihre ersten drei Fragen konzentrieren. Die kurzen Antworten lauten: (1) Sie müssen die Wirkung der IV auf den DV für jeden Zeitraum vergleichen, aber (2) nur ein Vergleich der Größen kann zu falschen Schlussfolgerungen führen, und (3) es gibt jedoch viele Möglichkeiten, dies zu tun Kein Konsens darüber, welcher richtig ist.
Im Folgenden beschreibe ich, warum Sie Koeffizientengrößen nicht einfach vergleichen und auf einige Lösungen hinweisen können, an die bisher gedacht wurde.
Laut Allison (1999) werden logistische Regressionskoeffizienten im Gegensatz zu OLS von einer nicht beobachteten Heterogenität beeinflusst, selbst wenn diese Heterogenität nicht mit der interessierenden Variablen zusammenhängt.
Wenn Sie eine logistische Regression wie folgt anpassen:
(1)
ln( 11 - pich) =β0+ β1x1 i
Sie passen tatsächlich eine Gleichung an, die den Wert einer latenten Variablen vorhersagt , die die zugrunde liegende Neigung jeder Beobachtung darstellt, den Wert 1 in der binär abhängigen Variablen anzunehmen. Was passiert, wenn y ∗ über einem bestimmten Schwellenwert liegt? Die Gleichung dafür lautet (Williams, 2009):y∗1y∗
(2)
y∗= α0+ α1x1 i+ σε
Es wird angenommen, dass der Begriff ; von den anderen Begriffen unabhängig ist und einer logistischen Verteilung folgt - oder einer Normalverteilung im Fall von Probit und einer logistischen Verteilung im Fall von komplementärem Log-Log und einer Cauchy-Verteilung im Fall von Cauchit .ε
Nach Williams (2009) stehen die Koeffizienten in Gleichung 2 in Beziehung zu den β- Koeffizienten in Gleichung 1 durch:αβ
(3)
βj= αjσj = 1 , . . . , J..
In den Gleichungen 2 und 3 ist der Skalierungsfaktor der nicht beobachteten Variation, und wir können sehen, dass die Größe der geschätzten β- Koeffizienten von σ abhängt , was nicht beobachtet wird. Auf dieser Grundlage behaupten Allison (1999), Williams (2009) und Mood (2009) unter anderem, dass Sie Koeffizienten zwischen logistischen Modellen, die für verschiedene Gruppen, Länder oder Zeiträume geschätzt wurden, nicht naiv vergleichen können.σβσ
Dies liegt daran, dass Vergleiche zu falschen Schlussfolgerungen führen können, wenn die nicht beobachteten Unterschiede zwischen Gruppen, Ländern oder Zeiträumen unterschiedlich sind. Beide Vergleiche mit unterschiedlichen Modellen und Interaktionstermen innerhalb desselben Modells leiden unter diesem Problem. Dies gilt neben logit auch für die Cousins probit, clog-log, cauchit und im weiteren Sinne für diskrete Zeitrisikomodelle, die mit diesen Link-Funktionen geschätzt werden. Bestellte Logit-Modelle sind ebenfalls davon betroffen.
Williams (2009) argumentiert, dass die Lösung darin besteht, die unbeobachtete Variation durch ein heterogenes Auswahlmodell (auch bekannt als Location-Scale-Modell) zu modellieren, und stellt ein dafür erforderliches Stata-Add-On bereit oglm
(Williams 2010). In R können heterogene Auswahlmodelle an die hetglm()
Funktion des glmx
Pakets angepasst werden, das über CRAN verfügbar ist. Beide Programme sind sehr einfach zu bedienen. Schließlich erwähnt Williams (2009) die PLUM
Routine von SPSS zum Anpassen dieser Modelle, aber ich habe sie nie verwendet und kann nicht sagen, wie einfach sie zu verwenden ist.
Es gibt jedoch mindestens ein Arbeitspapier, aus dem hervorgeht, dass Vergleiche mit heterogenen Auswahlmodellen noch verzerrter sein können, wenn die Varianzgleichung falsch angegeben ist oder ein Messfehler vorliegt.
Mood (2010) listet andere Lösungen auf, bei denen die Varianz nicht modelliert wird, sondern Vergleiche vorhergesagter Wahrscheinlichkeitsänderungen verwendet werden.
Anscheinend ist es ein Problem, das nicht geklärt ist, und ich sehe oft Beiträge auf Konferenzen meines Fachgebiets (Soziologie), die unterschiedliche Lösungen dafür finden. Ich würde Ihnen raten, sich anzusehen, was die Leute in Ihrem Bereich tun, und dann zu entscheiden, wie Sie damit umgehen sollen.
Verweise
- Allison, PD (1999). Vergleich von Logit- und Probit-Koeffizienten über Gruppen hinweg. Sociological Methods & Research, 28 (2), 186–208.
- Mood, C. (2010). Logistische Regression: Warum wir nicht tun können, was wir zu tun glauben und was wir dagegen tun können. European Sociological Review, 26 (1), 67–82.
- Williams, R. (2009). Verwenden heterogener Auswahlmodelle zum Vergleichen von Logit- und Probit-Koeffizienten über Gruppen hinweg. Sociological Methods & Research, 37 (4), 531–559.
- Williams, R. (2010). Anpassung heterogener Auswahlmodelle mit oglm. The Stata Journal, 10 (4), 540–567.