Die randomForest-Implementierung erlaubt keine Stichproben über die Anzahl der Beobachtungen hinaus, selbst wenn Stichproben mit Ersatz erstellt werden. Warum ist das?
Funktioniert gut:
rf <- randomForest(Species ~ ., iris, sampsize=c(1, 1, 1), replace=TRUE)
rf <- randomForest(Species ~ ., iris, sampsize=3, replace=TRUE)
Was ich machen will; was ich vorhabe zu tun:
rf <- randomForest(Species ~ ., iris, sampsize=c(51, 1, 1), replace=TRUE)
Error in randomForest.default(m, y, ...) :
sampsize can not be larger than class frequency
Ähnlicher Fehler ohne geschichtete Stichprobe:
rf <- randomForest(Species ~ ., iris, sampsize=151, replace=TRUE)
Error in randomForest.default(m, y, ...) : sampsize too large
Da ich erwartet hatte, dass die Methode in beiden Fällen Bootstrap-Beispiele nimmt, wenn replace = TRUE angegeben wird, habe ich dieses Limit nicht erwartet.
Mein Ziel ist es, dies mit der Option der geschichteten Stichprobe zu verwenden, um eine ausreichend große Stichprobe aus einer relativ seltenen Klasse zu ziehen.