Dieser Beitrag folgt diesem: Warum wird die Kammschätzung besser als die OLS, indem der Diagonale eine Konstante hinzugefügt wird?
Hier ist meine Frage:
Soweit ich weiß, verwendet die eine ℓ 2 -Norm (euklidischer Abstand). Aber warum verwenden wir das Quadrat dieser Norm? (Eine direkte Anwendung von ℓ 2 würde mit der Quadratwurzel der Summe des Beta-Quadrats resultieren).
Zum Vergleich machen wir dies nicht für den LASSO, der zur Regularisierung eine -Norm verwendet. Aber hier ist es die "echte" ℓ 1- Norm (nur die Summe des Quadrats der Beta-Absolutwerte und nicht das Quadrat dieser Summe).
Kann mir jemand bei der Klärung helfen?