Tut mir leid, wenn diese Frage etwas grundlegend ist.
Ich möchte die LASSO-Variablenauswahl für ein Modell mit mehreren linearen Regressionen in R verwenden. Ich habe 15 Prädiktoren, von denen einer kategorisch ist (wird das ein Problem verursachen?). Nach dem Setzen von und ich die folgenden Befehle:y
model = lars(x, y)
coef(model)
Mein Problem ist, wenn ich benutze coef(model)
. Dies gibt eine Matrix mit 15 Zeilen zurück, wobei jedes Mal ein zusätzlicher Prädiktor hinzugefügt wird. Es gibt jedoch keinen Vorschlag, welches Modell gewählt werden soll. Habe ich etwas verpasst Gibt es eine Möglichkeit, mit dem LARS-Paket nur ein " bestes " Modell zurückzugeben?
Es gibt andere Beiträge, die glmnet
stattdessen die Verwendung vorschlagen, aber dies scheint komplizierter zu sein. Ein Versuch ist wie folgt, wobei das gleiche und . Habe ich hier etwas verpasst ?: y
cv = cv.glmnet(x, y)
model = glmnet(x, y, type.gaussian="covariance", lambda=cv$lambda.min)
predict(model, type="coefficients")
Der letzte Befehl gibt eine Liste meiner Variablen zurück, die Mehrheit mit einem Koeffizienten, obwohl einige = 0 sind. Ist dies die richtige Wahl des von LASSO ausgewählten " besten " Modells? Wenn ich dann ein lineares Modell mit all meinen Variablen anpasse, die Koeffizienten hatten, not=0
erhalte ich sehr ähnliche, aber leicht unterschiedliche Koeffizientenschätzungen. Gibt es einen Grund für diesen Unterschied? Wäre es akzeptabel, das lineare Modell mit diesen von LASSO gewählten Variablen nachzurüsten und dies als mein endgültiges Modell zu verwenden? Ansonsten sehe ich keine p-Werte für die Signifikanz. Habe ich etwas verpasst
Tut
type.gaussian="covariance"
Stellen Sie sicher, dass glmnet
mehrere lineare Regressionen verwendet werden.
Hat die automatische Normalisierung der Variablen überhaupt Einfluss auf die Koeffizienten? Gibt es eine Möglichkeit, Interaktionsbegriffe in ein LASSO-Verfahren einzubeziehen?
Ich möchte dieses Verfahren eher als Demonstration dafür verwenden, wie LASSO verwendet werden kann, als für jedes Modell, das tatsächlich für wichtige Schlussfolgerungen / Vorhersagen verwendet wird, wenn dies etwas ändert.
Vielen Dank, dass Sie sich die Zeit genommen haben, dies zu lesen. Über allgemeine Kommentare zu LASSO / lars / glmnet würden wir uns ebenfalls sehr freuen.