Welche Methoden verwenden Entscheidungsbaum-Lernalgorithmen, um mit fehlenden Werten umzugehen?
Füllen sie einfach den Slot mit einem Wert namens missing aus?
Vielen Dank.
Welche Methoden verwenden Entscheidungsbaum-Lernalgorithmen, um mit fehlenden Werten umzugehen?
Füllen sie einfach den Slot mit einem Wert namens missing aus?
Vielen Dank.
Antworten:
Es gibt verschiedene Methoden, die von verschiedenen Entscheidungsbäumen verwendet werden. Das einfache Ignorieren der fehlenden Werte (wie ID3 und andere alte Algorithmen) oder das Behandeln der fehlenden Werte als eine andere Kategorie (im Falle eines nominalen Merkmals) sind keine echten Umgangsformen mit fehlenden Werten. Diese Ansätze wurden jedoch in den frühen Stadien der Entscheidungsbaumentwicklung verwendet.
Die reale Handhabung fehlender Daten verwendet keinen Datenpunkt mit fehlenden Werten bei der Auswertung eines Split. Wenn jedoch untergeordnete Knoten erstellt und trainiert werden, werden diese Instanzen auf irgendeine Weise verteilt.
Ich kenne die folgenden Ansätze zum Verteilen der Instanzen mit fehlenden Werten auf untergeordnete Knoten: