Zou u.a. "Auf den" Freiheitsgraden "des Lassos" (2007) zeigen, dass die Anzahl der Koeffizienten ungleich Null eine unvoreingenommene und konsistente Schätzung für die Freiheitsgrade des Lassos ist.
Es scheint mir ein wenig eingängig zu sein.
- Angenommen, wir haben ein Regressionsmodell (wobei die Variablen den Mittelwert Null haben).
- Angenommen, eine uneingeschränkte OLS-Schätzung von lautet . Es könnte ungefähr mit einer LASSO-Schätzung von für eine sehr geringe Strafintensität übereinstimmen .
- Nehmen wir weiter an, dass eine LASSO Schätzung für eine bestimmte Strafe Intensität ist . Zum Beispiel könnte das "optimale" für den Datensatz sein, der durch Kreuzvalidierung ermittelt wurde.
- Wenn ich es richtig verstehe, ist der Freiheitsgrad in beiden Fällen 1, da es beide Male einen von Null verschiedenen Regressionskoeffizienten gibt.
Frage:
- Wie kommt es, dass die Freiheitsgrade in beiden Fällen gleich sind, obwohl weniger "Freiheit" in der Anpassung nahe legt als ?
Verweise:
- Zou, Hui, Trevor Hastie und Robert Tibshirani. "Auf den" Freiheitsgraden "des Lassos." The Annals of Statistics 35.5 (2007): 2173-2192.