Ich arbeite derzeit daran, ein Vorhersagemodell für ein binäres Ergebnis in einem Datensatz mit ~ 300 Variablen und 800 Beobachtungen zu erstellen. Ich habe auf dieser Website viel über die Probleme gelesen, die mit der schrittweisen Regression verbunden sind, und warum man sie nicht verwendet.
Ich habe die LASSO-Regression und ihre Fähigkeit zur Funktionsauswahl gelesen und konnte sie erfolgreich mithilfe des "caret" -Pakets und "glmnet" implementieren.
Ich bin in der Lage, den Koeffizienten des Modells mit dem Optimum lambda
und alpha
aus "caret" zu extrahieren ; Ich bin jedoch nicht mit der Interpretation der Koeffizienten vertraut.
- Werden die LASSO-Koeffizienten nach der gleichen Methode wie die logistische Regression interpretiert?
- Wäre es angemessen, die von LASSO ausgewählten Funktionen für die logistische Regression zu verwenden?
BEARBEITEN
Interpretation der Koeffizienten wie bei den potenzierten Koeffizienten aus der LASSO-Regression als logarithmische Wahrscheinlichkeit für eine Änderung des Koeffizienten um 1 Einheit, während alle anderen Koeffizienten konstant gehalten werden.