Sei die Gruppierung, an der Sie interessiert sind. Das heißt, sei eine Partition von , wobei wir betrachten, dass es Merkmale gibt. Mit der Antwort und der Entwurfsmatrix lautet der Gruppen-Lasso-SchätzerWenn wir eine weitere quadratische Strafe , um eine Gesamtschrumpfung zu induzieren, erhalten wir den SchätzerGG{1,…,p}py∈RnX∈Rn×p
argminβ∈Rp12n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥2.
ℓ2argminβ∈Rp12n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥2+μ∥β∥22.
Wir könnten dies das "gruppenelastische Netz" nennen. Durch die Lagrange-Dualität können wir schreiben
argminβ∈Rp=argminβ∈Rp:∥β∥22≤C=argminβ∈Rp:∥β∥2≤C√=argminβ∈Rp=argminβ∈Rp12n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥2+μ∥β∥2212n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥212n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥212n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥2+μ~∥β∥212n∥y−Xβ∥22+(λ∑g∈G|G|1/2∥βg∥2+μ~′p1/2∥β∥2),
Dabei ist die entsprechende duale Variable und . Wie wir sehen können, ist dieser letzte Ausdruck ein Gruppen-Lasso mit "überlappenden" Gruppen, da keine Partition mehr ist. Ferner hat die Gruppe eine doppelte Variable (oder Abstimmungsvariable) die sich von der doppelten Variablen für die anderen Gruppen unterscheidet.
μ~μ~′=p−1/2μ~G∪{1,…,p}{1,…,p}μ~λ
Dies kann ein Optimierungsproblem sein, das mit dem Paket gelöst werden kann gglasso
. Wenn Sie den Abschnitt auf Seite 9 der Dokumentation lesen , erfahren Sie gglasso
, welche Funktion verwendet werden sollte. Beachten Sie, dass das Argument pmax
manuell mit einer letzten Komponente versehen werden muss, die als Optimierungsparameter dient.