Ich habe ein Klassifizierungsproblem mit kategorialen und numerischen Daten. Das Problem, mit dem ich konfrontiert bin, ist, dass meine kategorialen Daten nicht festgelegt sind. Dies bedeutet, dass der neue Kandidat, dessen Bezeichnung ich vorhersagen möchte, möglicherweise eine neue Kategorie hat, die zuvor nicht beobachtet wurde.
Wenn zum Beispiel meine kategorialen Daten sex
wären female
, wären die einzig möglichen Bezeichnungen male
und other
, egal was passiert. Meine kategoriale Variable ist jedoch city
so, dass es passieren kann, dass die Person, die ich vorhersagen möchte, eine neue Stadt hat, die mein Klassifikator noch nie gesehen hat.
Ich frage mich, ob es eine Möglichkeit gibt, die Klassifizierung in diesen Begriffen vorzunehmen, oder ob ich das Training unter Berücksichtigung dieser neuen kategorialen Daten erneut durchführen sollte.
city
basierend auf einer Funktion in eine Zahl konvertieren ? Aufcity' = f(latitude, longitude)
diese Weise können Sie einen neuen Wert für jede Stadt schaffen