Ich versuche Vorhersagen mit einem zufälligen Waldmodell in R zu machen.
Ich erhalte jedoch Fehler, da einige Faktoren im Testsatz andere Werte haben als im Trainingssatz. Beispielsweise hat ein Faktor Cat_2
Werte34, 68, 76
usw. in der Testmenge, die nicht in der Trainingsmenge erscheinen. Leider habe ich keine Kontrolle über das Test-Set ... Ich muss es so verwenden, wie es ist.
Meine einzige Problemumgehung bestand darin, die problematischen Faktoren mithilfe von wieder in numerische Werte umzuwandeln as.numeric()
. Es funktioniert, aber ich bin nicht sehr zufrieden, da diese Werte Codes sind, die keinen numerischen Sinn haben ...
Glauben Sie, es gäbe eine andere Lösung, um die neuen Werte aus dem Test-Set zu entfernen? Aber ohne alle anderen Faktorwerte (z. B. Werte 1, 2, 14, 32
usw.) zu entfernen , die sich sowohl im Training als auch im Test befinden und Informationen enthalten, die möglicherweise für Vorhersagen nützlich sind.