In meiner maschinellen Lernen Klasse haben wir gelernt , wie ist LASSO Regression sehr gut Merkmalsauswahl durchführen, da es die Verwendung von macht Regularisierung.
Meine Frage: Verwenden Benutzer das LASSO-Modell normalerweise nur zur Funktionsauswahl (und speichern diese Funktionen dann in einem anderen Modell für maschinelles Lernen) oder verwenden sie normalerweise LASSO, um sowohl die Funktionsauswahl als auch die tatsächliche Regression durchzuführen?
Angenommen, Sie möchten eine Gratregression durchführen, glauben jedoch, dass viele Ihrer Funktionen nicht sehr gut sind. Wäre es ratsam, LASSO auszuführen, nur die Funktionen zu verwenden, die vom Algorithmus nicht nahezu auf Null gesetzt werden, und dann nur diejenigen zu verwenden, um Ihre Daten in ein Ridge-Regressionsmodell zu übertragen? Auf diese Weise erhalten Sie den Vorteil einer Regularisierung für die Durchführung der Merkmalsauswahl, aber auch den Vorteil einer l 2 -Regulierung zur Reduzierung der Überanpassung. (Ich weiß, dass dies im Grunde genommen eine elastische Netzregression darstellt, aber es scheint, dass Sie nicht beide Terme l 1 und l 2 in der endgültigen Regressionszielfunktion haben müssen.)
Ist dies, abgesehen von der Regression, eine kluge Strategie bei der Durchführung von Klassifizierungsaufgaben (unter Verwendung von SVMs, neuronalen Netzen, zufälligen Wäldern usw.)?