Um SVM oder Neural Network zu verwenden, müssen kategoriale Variablen in numerische Variablen umgewandelt (kodiert) werden. In diesem Fall werden normalerweise 0-1 Binärwerte verwendet, wobei der k-te kategoriale Wert in (0,0, .. ., 1,0, ... 0) (1 ist auf der k-ten Position). Gibt es andere Methoden, um dies zu tun, insbesondere wenn es eine große Anzahl von kategorialen Werten gibt (z. B. 10000), so dass die 0-1-Darstellung eine große Anzahl zusätzlicher Dimensionen (Eingabeeinheiten) in das neuronale Netz einführt, was nicht ganz erwünscht oder erwartet erscheint ?
Ich frage nach allgemeinen Strategien.