Kann jemand den Unterschied zwischen dem RandomForestClassifier und dem ExtraTreesClassifier in scikit lernen erklären. Ich habe viel Zeit damit verbracht, die Zeitung zu lesen:
P. Geurts, D. Ernst. Und L. Wehenkel, "Extrem randomisierte Bäume", Machine Learning, 63 (1), 3-42, 2006
Es scheint, dass dies der Unterschied für ET ist:
1) Bei der Auswahl von Variablen bei einer Aufteilung werden Stichproben aus dem gesamten Trainingssatz anstelle eines Bootstrap-Beispiels des Trainingssatzes gezogen.
2) Splits werden bei jedem Split vollständig zufällig aus dem Wertebereich in der Stichprobe ausgewählt.
Das Ergebnis dieser beiden Dinge sind viel mehr "Blätter".