Ich verwende Lasso für die Merkmalsauswahl in einer relativ niedrigen Maßeinstellung (n >> p). Nach dem Anpassen eines Lasso-Modells möchte ich die Kovariaten mit Koeffizienten ungleich Null verwenden, um ein Modell ohne Abzug anzupassen. Ich mache das, weil ich unvoreingenommene Schätzungen haben möchte, die Lasso mir nicht geben kann. Ich hätte auch gerne p-Werte und Konfidenzintervalle für die unvoreingenommene Schätzung.
Ich habe Probleme, Literatur zu diesem Thema zu finden. Die meiste Literatur, die ich finde, handelt davon, Konfidenzintervalle auf die Lasso-Schätzungen zu setzen, nicht auf ein überarbeitetes Modell.
Nach dem, was ich gelesen habe, führt das einfache Umrüsten eines Modells mit dem gesamten Datensatz zu unrealistisch kleinen p-Werten / Standardfehlern. Momentan scheint das Aufteilen von Stichproben (im Stil von Wasserman und Roeder (2014) oder Meinshausen et al. (2009)) eine gute Vorgehensweise zu sein, aber ich suche nach weiteren Vorschlägen.
Hat jemand dieses Problem festgestellt? Wenn ja, könnten Sie bitte einige Vorschläge machen.