Ist es besser, Features wie Monat und Stunde als Faktor oder numerisch in einem Modell für maschinelles Lernen zu codieren?
Einerseits halte ich die numerische Codierung für sinnvoll, da die Zeit vorwärts geht (auf den fünften Monat folgt der sechste Monat), andererseits halte ich die kategoriale Codierung aufgrund der zyklischen Natur für sinnvoller von Jahren und Tagen (dem 12. Monat folgt der erste).
Gibt es eine allgemeine Lösung oder Konvention dafür?