Ich bin ein bisschen neu in Datamining / Maschinelles Lernen / etc. und haben über ein paar Möglichkeiten gelesen, mehrere Modelle und Läufe desselben Modells zu kombinieren, um Vorhersagen zu verbessern.
Mein Eindruck beim Lesen einiger Artikel (die oft interessant und großartig in Bezug auf Theorie und griechische Buchstaben, aber kurz in Bezug auf Code und aktuelle Beispiele sind) ist, dass es so aussehen soll:
Ich nehme ein Modell ( knn
, RF
usw.) und erhalte eine Liste von Klassifikatoren zwischen 0 und 1. Meine Frage ist, wie man diese Listen von Klassifikatoren kombiniert. Führe ich auf meinem Trainingsset dieselben Modelle aus, sodass die Anzahl der Spalten im endgültigen Modell gleich ist, oder gibt es einen anderen Trick?
Es wäre toll, wenn irgendwelche Vorschläge / Beispiele R-Code enthalten.
HINWEIS: Dies gilt für einen Datensatz mit 100.000 Zeilen im Trainingssatz und 70.000 Zeilen im Testsatz und 10 Spalten.