In "The Elements of Statistical Learning" (2. Aufl.), S. 63, geben die Autoren die folgenden zwei Formulierungen des Gratregressionsproblems an:
und
Es wird behauptet, dass die beiden äquivalent sind und dass es eine Eins-zu-Eins-Entsprechung zwischen den Parametern und .t
Es scheint, dass die erste Formulierung eine Lagrange-Relaxation der zweiten ist. Ich hatte jedoch nie ein intuitives Verständnis dafür, wie oder warum Lagrange-Relaxationen wirken.
Gibt es einen einfachen Weg, um zu zeigen, dass die beiden Formulierungen tatsächlich gleichwertig sind? Wenn ich mich entscheiden muss, ziehe ich Intuition der Strenge vor.
Vielen Dank.