Wir alle kennen die in der Literatur gut dokumentierte Vorstellung, dass die LASSO-Optimierung (der Einfachheit halber hier auf den Fall der linearen Regression beschränkt) ist äquivalent zu dem linearen Modell mit Gaußschen Fehlern, bei dem die Parameter mit dem Laplace-Prioritätswert sind. , je größer der Anteil der Parameter ist, desto Null wird gesetzt. Vor diesem Hintergrund habe ich folgende Gedankenfrage:
Man bedenke, dass man aus Bayes-Sicht die posteriore Wahrscheinlichkeit berechnen kann, dass beispielsweise die Nicht-Null-Parameterschätzungen in einer gegebenen Sammlung von Intervallen liegen und die vom LASSO auf Null gesetzten Parameter gleich Null sind. Was mich verwirrt hat, ist, dass der Laplace-Prior stetig ist (tatsächlich absolut stetig). Wie kann es dann irgendeine Masse auf einer Menge geben, die ein Produkt von Intervallen und Singuletten bei ?