Ich versuche die Regressionsaufgabe zu lösen. Ich habe herausgefunden, dass 3 Modelle für verschiedene Teilmengen von Daten gut funktionieren: LassoLARS, SVR und Gradient Tree Boosting. Mir ist aufgefallen, dass ich, wenn ich mit all diesen drei Modellen Vorhersagen mache und dann eine Tabelle mit den tatsächlichen Ergebnissen meiner drei Modelle erstelle, sehe, dass jedes Mal mindestens eines der Modelle den tatsächlichen Ergebnissen sehr nahe kommt, obwohl es zwei andere sind könnte relativ weit weg sein.
Wenn ich den minimal möglichen Fehler berechne (wenn ich für jedes Testbeispiel die Vorhersage vom 'besten' Prädiktor nehme), erhalte ich einen Fehler, der viel kleiner ist als der Fehler eines Modells allein. Also dachte ich darüber nach, Vorhersagen aus diesen drei verschiedenen Modellen zu einer Art Ensemble zusammenzufassen. Die Frage ist, wie man das richtig macht? Alle meine 3 Modelle werden mit Hilfe von Scikit-Learn erstellt und optimiert. Bietet es eine Methode, um Modelle in ein Ensemble zu packen? Das Problem hierbei ist, dass ich nicht nur die Vorhersagen aller drei Modelle mitteln möchte, sondern dies mit Gewichtung tun möchte, wobei die Gewichtung auf der Grundlage von Eigenschaften eines bestimmten Beispiels bestimmt werden sollte.
Auch wenn scikit-learn diese Funktionalität nicht bietet, wäre es schön, wenn jemand weiß, wie man diese Aufgabe löst - die Gewichtung jedes Modells für jedes Beispiel in Daten herauszufinden. Ich denke, dass es durch einen separaten Regressor möglich ist, der auf all diesen 3 Modellen aufbaut und versucht, für jedes der 3 Modelle ein optimales Gewicht auszugeben, aber ich bin mir nicht sicher, ob dies der beste Weg ist, dies zu tun.