Ich habe verstanden, dass Random Forest und Extrem Randomized Trees sich dahingehend unterscheiden, dass die Aufteilung der Bäume im Random Forest deterministisch ist, wohingegen sie im Fall von Extrem Randomized Trees zufällig ist (genauer gesagt, die nächste Aufteilung ist die beste Aufteilung) unter zufälligen gleichmäßigen Aufteilungen in den ausgewählten Variablen für den aktuellen Baum). Aber ich verstehe die Auswirkungen dieser unterschiedlichen Spaltungen in verschiedenen Situationen nicht vollständig.
- Wie vergleichen sie sich in Bezug auf Voreingenommenheit / Varianz?
- Wie vergleichen sie bei Vorhandensein irrelevanter Variablen?
- Wie vergleichen sie in Gegenwart von korrelierten Variablen?
uniform split
?