Warum unterscheidet sich das „entspannte Lasso“ vom Standard-Lasso?


16

Wenn wir mit einer Datenmenge , Lasso anwenden und eine Lösung β L erhalten , können wir Lasso erneut auf die Datenmenge ( X S , Y ) anwenden , wobei S die Menge ungleich Null ist Indizes von β L , um eine Lösung zu erhalten , β R L , die so genannte ‚entspannt LASSO‘ Lösung (korrigiert mich wenn ich falsch liege!). Die Lösung β L muss die Karush-Kuhn-Tucker (KKT) -Bedingungen für ( X , Y ) erfüllen(X,Y)βL(XS,Y)SβLβRLβL(X,Y)aber erfüllt es angesichts der Form der KKT-Bedingungen für diese nicht auch? Wenn ja, was bringt es, LASSO ein zweites Mal zu machen?(XS,Y)

Diese Frage ist eine Fortsetzung von: Vorteile des "Double Lasso" oder des zweimaligen Durchführens von Lasso?

Antworten:


10

Nach Definition 1 von Meinshausen (2007) gibt es zwei Parameter, die die Lösung des entspannten Lassos steuern.

Das erste, , steuert die Variablenauswahl, während das zweite, ϕ , den Schrumpfungsgrad steuert. Wenn ϕ = 1 ist, sind sowohl Lasso als auch Relaxed-Lasso dasselbe (wie Sie gesagt haben!), Aber für ϕ < 1 erhalten Sie eine Lösung mit Koeffizienten, die näher an der orthogonalen Projektion der ausgewählten Variablen liegen (Art der weichen Verzerrung) ).λϕϕ=1ϕ<1

Diese Formulierung entspricht tatsächlich der Lösung zweier Probleme:

  1. λ
  2. XSXλϕ
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.