Ich weiß nicht, ob dies eine gängige / bewährte Vorgehensweise ist, aber es ist eine andere Sichtweise der Sache.
Wenn Sie beispielsweise ein Datum haben, können Sie jedes Feld als "Kategorievariable" anstatt als "kontinuierliche Variable" behandeln. Der Tag hätte einen Wert in der Menge {1, 2 ..., 31}, der Monat hätte einen Wert in {1, ..., 12} und für das Jahr wählen Sie einen minimalen und einen maximalen Wert und baue ein Set.
Da die spezifischen numerischen Werte von Tagen, Monaten und Jahren möglicherweise nicht zum Auffinden von Trends in den Daten nützlich sind, verwenden Sie eine binäre Darstellung, um die numerischen Werte zu codieren, da jedes Bit ein Merkmal ist. Zum Beispiel wäre Monat 5 0 0 0 0 1 0 0 0 0 0 0 0
(11 0 ist eine 1 an fünfter Stelle, wobei jedes Bit ein Merkmal ist).
Wenn also beispielsweise 10 Jahre im "Jahressatz" liegen, wird ein Datum in einen Vektor mit 43 Merkmalen (= 31 + 12 + 10) umgewandelt. Bei Verwendung von "spärlichen Vektoren" sollte die Anzahl der Features kein Problem darstellen.
Ähnliches könnte für Zeitdaten, Wochentag, Tag des Monats geschehen ...
Es hängt alles von der Frage ab, die Ihr maschinelles Lernmodell beantworten soll.