Ich habe einen Datensatz, der sowohl kategoriale als auch kontinuierliche Variablen enthält. Mir wurde geraten, die kategorialen Variablen als Binärvariablen für jede Ebene zu transformieren (dh A_level1: {0,1}, A_level2: {0,1}) - ich denke, einige haben dies "Dummy-Variablen" genannt.
Wäre es dann irreführend, den gesamten Datensatz mit den neuen Variablen zu zentrieren und zu skalieren? Es scheint, als würde ich die "Ein / Aus" -Bedeutung der Variablen verlieren.
Wenn es irreführend ist, sollte ich dann die stetigen Variablen separat zentrieren und skalieren und sie dann erneut zu meinem Datensatz hinzufügen?
TIA.