Ich führe eine logistische Regression mit einem binären Ergebnis durch (Start und nicht Start). Mein Prädiktormix besteht entweder aus kontinuierlichen oder dichotomen Variablen.
Bei Verwendung des Box-Tidwell-Ansatzes verstößt einer meiner kontinuierlichen Prädiktoren möglicherweise gegen die Annahme der Linearität des Logits. Aus den Statistiken zur Anpassungsgüte geht nicht hervor, dass die Anpassung problematisch ist.
Anschließend habe ich das Regressionsmodell erneut ausgeführt und die ursprüngliche kontinuierliche Variable durch Folgendes ersetzt: Erstens eine Quadratwurzeltransformation und zweitens eine dichotome Version der Variablen.
Bei Betrachtung der Ausgabe scheint sich die Anpassungsgüte geringfügig zu verbessern, aber Residuen werden problematisch. Parameterschätzungen, Standardfehler und bleiben relativ ähnlich. Die Interpretation der Daten ändert sich in Bezug auf meine Hypothese in den drei Modellen nicht.
In Bezug auf die Nützlichkeit meiner Ergebnisse und den Sinn für die Interpretation von Daten erscheint es daher angebracht, das Regressionsmodell unter Verwendung der ursprünglichen kontinuierlichen Variablen zu melden.
Ich frage mich:
- Wann ist die logistische Regression robust gegen die mögliche Verletzung der Linearität der Logit-Annahme?
- Scheint es angesichts meines obigen Beispiels akzeptabel, die ursprüngliche kontinuierliche Variable in das Modell aufzunehmen?
- Gibt es Referenzen oder Anleitungen, die empfohlen werden können, wenn es zufriedenstellend ist zu akzeptieren, dass das Modell robust gegen die mögliche Verletzung der Linearität des Logits ist?