Für das LASSO (und andere Modellauswahlverfahren) ist es entscheidend, die Prädiktoren neu zu skalieren. Die allgemeine Empfehlung, der ich folge, ist einfach, eine Normierung mit 0 Mittelwerten und 1 Standardabweichung für kontinuierliche Variablen zu verwenden. Aber was gibt es mit Dummies zu tun?
ZB einige angewandte Beispiele aus derselben (ausgezeichneten) Sommerschule, die ich verlinkt habe, skalieren stetige Variablen neu auf 0 bis 1 (allerdings nicht großartig bei Ausreißern), wahrscheinlich um mit den Dummies vergleichbar zu sein. Aber auch das garantiert nicht, dass die Koeffizienten in der gleichen Größenordnung liegen sollten, und bestraft damit in ähnlicher Weise den Hauptgrund für eine Neuskalierung, oder?