Angenommen, ich habe mehrere Modelle auf dem Trainingsset trainiert und das beste mit dem Kreuzvalidierungsset und der gemessenen Leistung auf dem Testset ausgewählt. Jetzt habe ich ein letztes bestes Modell. Sollte ich alle verfügbaren Daten oder Schiffslösungen, die nur auf dem Schulungsset trainiert wurden, erneut trainieren? Wenn letzteres, warum dann?
UPDATE: Wie @ P.Windridge feststellte, bedeutet der Versand eines umgeschulten Modells im Wesentlichen den Versand eines Modells ohne Validierung. Wir können jedoch die Leistung von Test-Sets melden und anschließend das Modell mit vollständigen Daten neu trainieren, wobei wir zu Recht erwarten, dass die Leistung besser wird - weil wir unser bestes Modell und mehr Daten verwenden. Welche Probleme können sich aus einer solchen Methodik ergeben?