Ich baue ein Modell auf und denke, dass der geografische Standort meine Zielvariable wahrscheinlich sehr gut vorhersagen kann. Ich habe die Postleitzahl von jedem meiner Benutzer. Ich bin mir nicht ganz sicher, wie ich Postleitzahl als Vorhersagefunktion in mein Modell integrieren kann. Obwohl die Postleitzahl eine Zahl ist, hat sie keine Bedeutung, wenn die Zahl nach oben oder unten geht. Ich könnte alle 30.000 Postleitzahlen binarisieren und sie dann als Features oder neue Spalten einfügen (z. B. {user_1: {61822: 1, 62118: 0, 62444: 0, usw.}}. Dies scheint jedoch eine Tonne hinzuzufügen von Funktionen zu meinem Modell.
Überlegen Sie, wie Sie mit dieser Situation am besten umgehen können?