Die bestrafte L1-Regression (auch bekannt als Lasso) wird in zwei Formulierungen dargestellt. Die beiden Zielfunktionen seien Dann sind die beiden unterschiedlichen Formulierungen Argminβ
Die bestrafte L1-Regression (auch bekannt als Lasso) wird in zwei Formulierungen dargestellt. Die beiden Zielfunktionen seien Dann sind die beiden unterschiedlichen Formulierungen Argminβ
Antworten:
Die zwei Formulierungen sind äquivalent in dem Sinne, dass für jeden Wert von in der ersten Formulierung ein Wert von & lgr; für die zweite Formulierung existiert, so dass die zwei Formulierungen den gleichen Minimierer & bgr; aufweisen .
Hier ist die Begründung:
Betrachten Sie die Lasso-Formulierung: Sei der Minimiererβ∗und seib=| | β∗| | 1. Meine Behauptung ist, dass, wenn Siein der ersten Formulierungt=b setzen, die Lösung der ersten Formulierung ebenfallsβ∗ ist. Hier ist der Beweis:
Betrachten Sie die erste Formulierung wenn möglich diese zweite Formulierung lassen hat eine Lösung β , so dass| | & bgr; | | 1<| | β∗| | 1=b(beachten Sie das streng weniger als Zeichen). Dann ist es leicht zu sehendassf( β )<f(β
Da , ist die komplementäre Schlaffheitsbedingung am Lösungspunkt β ∗ erfüllt .
Wenn Sie also eine Lasso-Formulierung mit , konstruieren Sie eine beschränkte Formulierung mit einem t , das dem Wert der l 1 -Norm der Lasso-Lösung entspricht. Umgekehrt erhalten Sie bei einer eingeschränkten Formulierung mit t ein λ, so dass die Lösung des Lassos gleich der Lösung der eingeschränkten Formulierung ist.
(Wenn Sie Subgradienten kennen, können Sie dieses indem Sie die Gleichung X T ( y - X β ∗ ) = λ z ∗ lösen , wobei z ∗ ∈ ∂ | | β ∗ | | 1 )
Ich denke, dass die Idee von elexhobby für diesen Beweis gut ist, aber ich denke nicht, dass es völlig richtig ist.
Zeigen , dass das Vorhandensein einer Lösung für die erste , so dass ‖ β ‖ < ‖ β * ‖ führt zu einem Widerspruch, können wir nur die Notwendigkeit , übernehmen von ‖ β ‖ = ‖ β * ‖ , nicht dass β = β * .
Ich schlage stattdessen vor, wie folgt vorzugehen:
Der Einfachheit halber bezeichnen wir die erste und die zweite Formulierung mit bzw. P 2 . Nehmen wir an, dass P 2 eine eindeutige Lösung β ∗ mit ‖ β ∗ ‖ = b hat . Lassen P 1 eine Lösung, & bgr; & ne; & bgr; * . Dann haben wir das ‖ β ‖ ≤ ‖ β * ‖ (es kann nicht größer sein , weil der Zwang) und damit f ( β ) . Wenn f ( β ) < f ( β * ) dann β * ist nicht die Lösung für den P 2 , die unsere Annahmen widerspricht. Wenn f ( β ) = f ( β * ) dann β = β * , da wir die Lösung eindeutig sein angenommen.
. Lassen eine Lösung haben, . Then, we have that and therefore . If for some (and hence for all of them) then , which contradicts our assumptions. If for some then is not the set of solutions to . Therefore, every solution to is in , i.e. any solution to is also a solution to . It would remain to prove that the complementary holds too.