Gibt es eine R-Random-Forest-Implementierung, die mit sehr spärlichen Daten gut funktioniert? Ich habe Tausende oder Millionen von booleschen Eingabevariablen, aber nur Hunderte oder so werden für ein bestimmtes Beispiel WAHR sein.
Ich bin relativ neu in R und habe festgestellt, dass es ein 'Matrix'-Paket für den Umgang mit spärlichen Daten gibt, aber das standardmäßige' randomForest'-Paket scheint diesen Datentyp nicht zu erkennen. Wenn es darauf ankommt, werden die Eingabedaten außerhalb von R erzeugt und importiert.
Irgendein Rat? Ich kann auch Weka, Mahout oder andere Pakete verwenden.