Einige Vorhersagemodelltechniken sind eher für den Umgang mit kontinuierlichen Prädiktoren ausgelegt, während andere für den Umgang mit kategorialen oder diskreten Variablen besser geeignet sind. Natürlich gibt es Techniken, um einen Typ in einen anderen umzuwandeln (Diskretisierung, Dummy-Variablen usw.). Gibt es jedoch Vorhersagemodelltechniken, mit denen beide Eingabetypen gleichzeitig verarbeitet werden können, ohne dass lediglich die Art der Features geändert werden muss? Wenn ja, funktionieren diese Modellierungstechniken in der Regel besser für Daten, für die sie natürlicher sind?
Das Beste, was mir bekannt ist, ist, dass Entscheidungsbäume normalerweise gut mit diskreten Daten umgehen und kontinuierliche Daten verarbeiten, ohne dass eine vorherige Diskretisierung erforderlich ist . Dies ist jedoch nicht ganz das, wonach ich gesucht habe, da die Aufteilung auf fortlaufende Features effektiv nur eine Form der dynamischen Diskretisierung ist.
Als Referenz werden hier einige verwandte, nicht doppelte Fragen aufgeführt:
- Wie sollten Entscheidungsbaumaufteilungen implementiert werden, wenn kontinuierliche Variablen vorhergesagt werden?
- Kann ich multiple Regression verwenden, wenn ich kategoriale und kontinuierliche Prädiktoren gemischt habe?
- Ist es jemals sinnvoll, kategoriale Daten als fortlaufend zu behandeln?
- Kontinuierliche und kategoriale Analyse variabler Daten