Ich habe gelernt, dass wir uns beim Erstellen eines Regressionsmodells um kategoriale Variablen kümmern müssen, indem wir sie in Dummy-Variablen konvertieren. Wenn es in unserem Datensatz beispielsweise eine Variable wie location gibt:
Location
----------
Californian
NY
Florida
Wir müssen sie konvertieren wie:
1 0 0
0 1 0
0 0 1
Es wurde jedoch vorgeschlagen, eine Dummy-Variable zu verwerfen, unabhängig davon, wie viele Dummy-Variablen vorhanden sind.
Warum müssen wir eine Dummy-Variable verwerfen?