Dies kann auf verschiedene Arten angegriffen werden, einschließlich relativ wirtschaftlicher Ansätze über die Karush-Kuhn-Tucker-Bedingungen .
Im Folgenden finden Sie ein recht elementares alternatives Argument.
Die Lösung der kleinsten Quadrate für ein orthogonales Design
Angenommen, besteht aus orthogonalen Spalten. Dann ist die Lösung der kleinsten
β LS = ( X T X ) - 1 X T y = X T yX
β^LS=(XTX)−1XTy=XTy.
Einige äquivalente Probleme
Über die Lagrange-Form ist es einfach zu erkennen, dass ein zu dem in der Frage betrachteten äquivalentes Problem
minβ12∥y−Xβ∥22+γ∥β∥1.
Wenn wir den ersten Term erweitern, erhalten wir und da keine enthält von den interessierenden Variablen können wir es verwerfen und ein weiteres gleichwertiges Problem betrachten:
yTyminβ(-yTXβ+112yTy−yTXβ+12βTβyTy
minβ(−yTXβ+12∥β∥2)+γ∥β∥1.
Mit kann das vorherige Problem als umgeschrieben werden.
minβp Σ i=1 - β LS i & beta;i+1β^LS=XTy
minβ∑i=1p−β^LSiβi+12β2i+γ|βi|.
Unsere Zielfunktion ist nun eine Summe von Zielen, die jeweils einer separaten Variablen , sodass sie jeweils einzeln gelöst werden können.βi
Das Ganze ist gleich der Summe seiner Teile
Repariere ein bestimmtes . Dann wollen wir minimieren
L i = - β LS i & beta; i + 1i
Li=−β^LSiβi+12β2i+γ|βi|.
Wenn , müssen wir da wir sonst das Vorzeichen umdrehen und einen niedrigeren Wert für die Zielfunktion erhalten könnten. Wenn , müssen wir wählen .βi≥0 β LS i <0βi≤0β^LSi>0βi≥0β^LSi<0βi≤0
Fall 1 : . Da , ist
und dies in Bezug auf differenzieren und gleich Null zu setzen erhalten wir und dies ist nur möglich, wenn die rechte Seite nicht ist. In diesem Fall lautet die tatsächliche Lösung also
βi≥0Li= - β LS i & beta;i+1β^LSi>0βi≥0
Li=−β^LSiβi+12β2i+γβi,
βiβi=β^LSi−γβ^lassoi=(β^LSi−γ)+=sgn(β^LSi)(|β^LSi|−γ)+.
Fall 2 : . Dies impliziert, dass wir und daher
Differenziert man in Bezug auf und setzt es auf Null, so erhält man . Aber um dies zu gewährleisten, brauchen wir , was durch
β^LSi≤0βi≤0
Li=−β^LSiβi+12β2i−γβi.
βiβi=β^LSi+γ=sgn(β^LSi)(|β^LSi|−γ)βi≤0β^lassoi=sgn(β^LSi)(|β^LSi|−γ)+.
In beiden Fällen erhalten wir die gewünschte Form und sind fertig.
Schlussbemerkungen
Beachten Sie, dass mit zunehmendem jedes dernimmt notwendigerweise ab, daher auch . Wenn , werden die OLS-Lösungen wiederhergestellt, und fürerhalten wir für alle .γ|β^lassoi|∥β^lasso∥1γ=0γ>maxi|β^LSi|β^lassoi=0i