[NB: Siehe Update 1 unten.] Ich finde, dass die Methodik für rpart
viel einfacher zu erklären ist als party
. Letzteres ist jedoch weitaus ausgefeilter und bietet wahrscheinlich bessere Modelle. Die Art, wie ich es manchmal erkläre, party
ist, davon als Grundlage für die Herstellung lokaler linearer (oder GLM) Modelle zu sprechen. Ich baue darauf auf, indem ich darauf hinweise, dass die Ergebnisse für rpart
alle Elemente, die in den Blattknoten fallen, dh die durch die Teilungen begrenzte Box / Region, konstant sind. Selbst wenn es Verbesserungen über lokale Modelle geben sollte, erhalten Sie nur eine konstante Vorhersage.
Im Gegensatz dazu werden party
die Splits entwickelt, um potenziell die Modelle für die Regionen zu optimieren. Tatsächlich werden andere Kriterien als die Modelloptimalität verwendet, aber Sie müssen Ihre eigene Fähigkeit zur Erklärung des Unterschieds messen, um zu bestimmen, ob Sie ihn gut erklären können. Die Papiere für sie recht zugänglich für Forscher sind, kann aber durchaus für jemanden nicht bereit , eine Herausforderung werden , zu prüfen , einfachere Methoden wie zufällige Wälder, die Förderung usw. Mathematisch denke ich , dass party
anspruchsvollere ist ... Trotzdem CART Modelle sind leichter zu Sowohl methodisch als auch in Bezug auf die Ergebnisse zu erläutern, und diese bieten einen guten Ansatz für die Einführung komplexerer baumbasierter Modelle.
Kurz gesagt, ich würde sagen, dass Sie rpart
für Klarheit party
sorgen müssen und Sie können für Genauigkeit / Leistung verwenden, aber ich würde nicht vorstellen, party
ohne einzuführen rpart
.
Update 1. Ich habe meine Antwort auf mein Verständnis von party
vor ein oder zwei Jahren gestützt . Es ist ziemlich erwachsen geworden, aber ich würde meine Antwort dahingehend ändern, dass ich es rpart
aufgrund seiner Kürze und seines Vermächtnisses immer noch empfehlen würde , sollte "unkonventionell" ein wichtiges Kriterium für Ihren Kunden / Mitarbeiter sein. Dennoch würde ich versuchen, mit mehr Funktionalität von zu migrieren party
, nachdem ich jemanden vorgestellt habe rpart
. Es ist besser, klein anzufangen, mit Verlustfunktionen, Aufteilungskriterien usw. in einem einfachen Kontext, bevor Sie ein Paket und eine Methodik einführen, die weitaus komplexere Konzepte beinhalten.