Mir ist klar, dass das Boosting-Tree-Modell 3 Tuning-Parameter enthält, d. H.
- die Anzahl der Bäume (Anzahl der Iterationen)
- Schrumpfungsparameter
- Anzahl der Teilungen (Größe der einzelnen Bäume)
Meine Frage ist: Wie soll ich für jeden der Abstimmungsparameter den optimalen Wert finden? Und welche Methode?
Beachten Sie Folgendes: Der Parameter für die Schrumpfung und der Parameter für die Anzahl der Bäume arbeiten zusammen, dh ein kleinerer Wert für den Parameter für die Schrumpfung führt zu einem höheren Wert für die Anzahl der Bäume. Und das müssen wir auch berücksichtigen.
Ich interessiere mich besonders für die Methode, um den optimalen Wert für die Anzahl der Teilungen zu finden. Sollte es auf Kreuzvalidierung oder Domänenwissen über das dahinter stehende Modell basieren?
Und wie werden diese Dinge im gbm
Paket in R ausgeführt?