Dies ist eine Frage zu einer Praxis oder Methode, die von einigen meiner Kollegen befolgt wird. Bei der Erstellung eines logistischen Regressionsmodells habe ich gesehen, dass Personen kategoriale Variablen (oder fortlaufende Variablen, die in Gruppen zusammengefasst sind) durch ihre jeweilige Beweiskraft (Weight of Evidence, WoE) ersetzen. Dies soll eine monotone Beziehung zwischen dem Regressor und der abhängigen Variablen herstellen. Soweit ich weiß, sind die Variablen in der Gleichung nach der Erstellung des Modells NICHT die Variablen im Datensatz. Vielmehr sind die Variablen in der Gleichung nun sozusagen die Wichtigkeit oder das Gewicht der Variablen bei der Trennung der abhängigen Variablen !
Meine Frage ist: Wie interpretieren wir nun das Modell oder die Modellkoeffizienten? Zum Beispiel für die folgende Gleichung:
Wir können sagen, dass die relative Zunahme des ungeraden Verhältnisses für eine Einheit der Zunahme der Variablen x 1 ist .
Wenn die Variable jedoch durch ihr WoE ersetzt wird, ändert sich die Interpretation in: Relative Erhöhung des ungeraden Verhältnisses für 1 Einheit Erhöhung der WICHTIGKEIT / des GEWICHTS der Variablen
Ich habe diese Praxis im Internet gesehen, aber nirgends habe ich eine Antwort auf diese Frage gefunden. Dieser Link aus dieser Community selbst bezieht sich auf eine ähnliche Abfrage, in der jemand Folgendes geschrieben hat:
WoE zeigt eine lineare Beziehung zum natürlichen Logarithmus des Odds Ratio, der die abhängige Variable in der logistischen Regression ist. Daher stellt sich bei der logistischen Regression nicht die Frage der Modellfehlspezifikation, wenn WoE anstelle der tatsächlichen Werte der Variablen verwendet wird.
Aber ich verstehe die Erklärung immer noch nicht. Bitte helfen Sie mir zu verstehen, was ich vermisse.