Kurze Antwort
CARTs benötigen Hilfe bei der Erfassung von Interaktionen.
Lange Antwort
Nehmen Sie den genauen gierigen Algorithmus (Chen und Guestrin, 2016):
Der Mittelwert auf dem Blatt ist eine bedingte Erwartung, aber jede Aufteilung auf dem Weg zum Blatt ist unabhängig von der anderen. Wenn Feature A für sich genommen keine Rolle spielt, aber für die Interaktion mit Feature B von Bedeutung ist, wird der Algorithmus nicht auf Feature A aufgeteilt. Ohne diese Aufteilung kann der Algorithmus die Aufteilung auf Feature B nicht vorhersehen, die zum Generieren der Interaktion erforderlich ist.
Bäume können in den einfachsten Szenarien Interaktionen auswählen. Wenn Sie einen Datensatz mit zwei Merkmalen und Ziel , muss der Algorithmus nur auf und werden. Daher erhalten Sie vier Blätter, wobei richtig geschätzt wird.x1,x2y=XOR(x1,x2)x1x2XOR
Mit vielen Funktionen, der Regularisierung und der harten Begrenzung der Anzahl der Teilungen kann derselbe Algorithmus Interaktionen auslassen.
Problemumgehungen
Explizite Interaktionen als neue Funktionen
Ein Beispiel von Zhang ("Winning Data Science Competitions", 2015):
Nicht gierige Baumalgorithmen
In der anderen Frage schlägt Simone Lookahead-basierte Algorithmen und schräge Entscheidungsbäume vor .
Ein anderer Lernansatz
Einige Lernmethoden handhaben Interaktionen besser.
Hier ist eine Tabelle aus Die Elemente des statistischen Lernens (Zeile "Fähigkeit, lineare Kombinationen von Merkmalen zu extrahieren"):