Eine der Beweggründe für das elastische Netz war die folgende Einschränkung von LASSO:
Im Fall wählt das Lasso aufgrund der Art des konvexen Optimierungsproblems höchstens n Variablen aus, bevor es gesättigt wird. Dies scheint ein einschränkendes Merkmal für eine variable Auswahlmethode zu sein. Darüber hinaus ist das Lasso nur dann gut definiert, wenn die Grenze für die L1-Norm der Koeffizienten kleiner als ein bestimmter Wert ist.
( http://onlinelibrary.wiley.com/doi/10.1111/j.1467-9868.2005.00503.x/full )
Ich verstehe, dass LASSO ein quadratisches Programmierproblem ist, aber auch über LARS oder elementweisen Gradientenabstieg gelöst werden kann. Ich verstehe jedoch nicht, wo bei diesen Algorithmen ein Problem auftritt, wenn wobei p die Anzahl der Prädiktoren und n die Stichprobengröße ist. Und warum wird dieses Problem mit dem elastischen Netz gelöst, bei dem ich das Problem auf p + n- Variablen erweitere, die deutlich über p liegen .