[NB: Siehe Update 1 unten.] Ich finde, dass die Methodik für rpartviel einfacher zu erklären ist als party. Letzteres ist jedoch weitaus ausgefeilter und bietet wahrscheinlich bessere Modelle. Die Art, wie ich es manchmal erkläre, partyist, davon als Grundlage für die Herstellung lokaler linearer (oder GLM) Modelle zu sprechen. Ich baue darauf auf, indem ich darauf hinweise, dass die Ergebnisse für rpartalle Elemente, die in den Blattknoten fallen, dh die durch die Teilungen begrenzte Box / Region, konstant sind. Selbst wenn es Verbesserungen über lokale Modelle geben sollte, erhalten Sie nur eine konstante Vorhersage.
Im Gegensatz dazu werden partydie Splits entwickelt, um potenziell die Modelle für die Regionen zu optimieren. Tatsächlich werden andere Kriterien als die Modelloptimalität verwendet, aber Sie müssen Ihre eigene Fähigkeit zur Erklärung des Unterschieds messen, um zu bestimmen, ob Sie ihn gut erklären können. Die Papiere für sie recht zugänglich für Forscher sind, kann aber durchaus für jemanden nicht bereit , eine Herausforderung werden , zu prüfen , einfachere Methoden wie zufällige Wälder, die Förderung usw. Mathematisch denke ich , dass partyanspruchsvollere ist ... Trotzdem CART Modelle sind leichter zu Sowohl methodisch als auch in Bezug auf die Ergebnisse zu erläutern, und diese bieten einen guten Ansatz für die Einführung komplexerer baumbasierter Modelle.
Kurz gesagt, ich würde sagen, dass Sie rpartfür Klarheit partysorgen müssen und Sie können für Genauigkeit / Leistung verwenden, aber ich würde nicht vorstellen, partyohne einzuführen rpart.
Update 1. Ich habe meine Antwort auf mein Verständnis von partyvor ein oder zwei Jahren gestützt . Es ist ziemlich erwachsen geworden, aber ich würde meine Antwort dahingehend ändern, dass ich es rpartaufgrund seiner Kürze und seines Vermächtnisses immer noch empfehlen würde , sollte "unkonventionell" ein wichtiges Kriterium für Ihren Kunden / Mitarbeiter sein. Dennoch würde ich versuchen, mit mehr Funktionalität von zu migrieren party, nachdem ich jemanden vorgestellt habe rpart. Es ist besser, klein anzufangen, mit Verlustfunktionen, Aufteilungskriterien usw. in einem einfachen Kontext, bevor Sie ein Paket und eine Methodik einführen, die weitaus komplexere Konzepte beinhalten.