Ich habe es wahrscheinlich mit einem Problem zu tun, das wahrscheinlich schon hundert Mal gelöst wurde, aber ich bin mir nicht sicher, wo ich die Antwort finden kann.
Bei Verwendung der logistischen Regression werden bei vielen Funktionen und versuchen , einen binären kategorischen Wert vorherzusagen , y , ich bin daran interessiert , einen Teil der Funktionen bei der Auswahl , die vorhersagt gut.
Gibt es ein ähnliches Verfahren wie das Lasso? (Ich habe nur das Lasso gesehen, das für die lineare Regression verwendet wird.)
Zeigt die Betrachtung der Koeffizienten des angepassten Modells die Bedeutung der verschiedenen Merkmale an?
Bearbeiten - Erläuterungen Nachdem Sie einige der Antworten gesehen haben:
Wenn ich mich auf die Größe der angepassten Koeffizienten beziehe, meine ich diejenigen, die an normalisierte Merkmale (Mittelwert 0 und Varianz 1) angepasst sind. Andernfalls würde 1000x, wie @probabilityislogic hervorhob, weniger wichtig erscheinen als x.
Ich bin nicht daran interessiert, einfach die beste k-Teilmenge zu finden (wie @Davide angeboten hat), sondern die Bedeutung verschiedener Funktionen im Verhältnis zueinander abzuwägen. Beispielsweise könnte ein Merkmal "Alter" und das andere Merkmal "Alter> 30" sein. Ihre inkrementelle Bedeutung mag gering sein, aber beide mögen wichtig sein.