Bei der komprimierten Abtastung gibt es einen Satz, der garantiert, dass
Gibt es einen ähnlichen Satz für Lasso? Wenn es einen solchen Satz gibt, garantiert er nicht nur die Stabilität des Lassos, sondern bietet dem Lasso auch eine aussagekräftigere Interpretation:
Lasso kann den spärlichen Regressionskoeffizientenvektor aufdecken, der verwendet wird, um die Antwort durch zu erzeugen .
Es gibt zwei Gründe, warum ich diese Frage stelle:
Ich denke, "Lasso bevorzugt eine spärliche Lösung" ist keine Antwort darauf, warum Lasso für die Funktionsauswahl verwendet wird, da wir nicht einmal sagen können, welchen Vorteil die von uns ausgewählten Funktionen haben.
Ich habe gelernt, dass Lasso dafür berüchtigt ist, bei der Auswahl von Features instabil zu sein. In der Praxis müssen wir Bootstrap-Beispiele ausführen, um die Stabilität zu bewerten. Was ist der wichtigste Grund für diese Instabilität?
Blinddarm:
Gegeben ist . ist ein sparsamer Vektor ( ). Der Prozess erzeugt die Antwort . Wenn den NSP (Nullraum-Eigenschaft) der Ordnung und die Kovarianzmatrix von keinen Eigenwert nahe Null hat, gibt es eine eindeutige Lösung für was genau das , das ergibt
Was dieser Satz auch sagt, ist auch, wenn nicht den NSP der Ordnung , ist es einfach hoffnungslos, .Ω argmin c : y = X c ‖ c ‖ 1
BEARBEITEN:
Nachdem ich diese großartigen Antworten erhalten hatte, stellte ich fest, dass ich verwirrt war, als ich diese Frage stellte.
Warum diese Frage verwirrend ist:
Ich habe eine Forschungsarbeit gelesen , in der wir entscheiden müssen, wie viele Merkmale (Spalten) die Entwurfsmatrix haben wird (Hilfsmerkmale werden aus primären Merkmalen erstellt). Da es sich um ein typisches Problem handelt, wird erwartet, dass gut konstruiert ist, so dass die Lösung für Lasso eine gute Annäherung an die real spärliche Lösung sein kann.
Die Argumentation ergibt sich aus dem Satz, den ich im Anhang erwähnt habe: Wenn wir eine sparsame Lösung c finden wollen , hat X besser den NSP der Ordnung Ω .
Wenn für eine allgemeine Matrix N > C Ω ln M verletzt wird, dann
Eine stabile und robuste Gewinnung von aus D und P ist nicht möglich
entspricht X , P entspricht y
... wie aus der Beziehung erwartet , wird die Auswahl des Deskriptors instabiler, dh für verschiedene Trainingssätze unterscheidet sich der ausgewählte Deskriptor häufig ...
Das zweite Zitat ist der Teil, der mich verwirrt. Es scheint mir, wenn die Ungleichung verletzt wird, ist es nicht nur die Lösung, die möglicherweise nicht eindeutig ist (nicht erwähnt), sondern der Deskriptor wird auch instabiler.