Ich möchte eine zufällige Gesamtstruktur mit dem folgenden Verfahren erstellen:
- Erstellen Sie einen Baum aus zufälligen Stichproben der Daten und Features, und verwenden Sie dabei den Informationsgewinn, um die Aufteilung zu bestimmen
- Beenden Sie einen Blattknoten, wenn er eine vordefinierte Tiefe überschreitet, ODER wenn eine Teilung zu einer Blattanzahl führen würde, die unter einem vordefinierten Minimum liegt
- Anstatt jedem Baum eine Klassenbezeichnung zuzuweisen, weisen Sie den Anteil der Klassen im Blattknoten zu
- Stoppen Sie das Bauen von Bäumen, nachdem eine vordefinierte Anzahl erstellt wurde
Hierdurch wird der traditionelle Zufallswaldprozess auf zwei Arten gestört. Erstens werden beschnittene Bäume verwendet, die Proportionen anstelle von Klassenbeschriftungen zuweisen. Und zweitens ist das Stoppkriterium eine vorher festgelegte Anzahl von Bäumen und keine geschätzte Anzahl von Out-of-Bag-Fehlern.
Meine Frage lautet:
Kann ich für den obigen Prozess, der N Bäume ausgibt, ein Modell unter Verwendung der logistischen Regression mit LASSO-Auswahl anpassen? Hat jemand Erfahrung mit der Anpassung eines Random Forest-Klassifikators und der Nachbearbeitung mit logistic LASSO?
Das ISLE-Framework erwähnt die Verwendung von LASSO als Nachbearbeitungsschritt für Regressionsprobleme, jedoch nicht für Klassifizierungsprobleme. Außerdem erhalte ich beim Googeln von "Random Forest Lasso" keine hilfreichen Ergebnisse.