Ich bin mir nicht einmal sicher, ob die Frage wirklich Sinn macht, aber ich glaube, ich habe einige Titel von Artikeln gesehen, in denen zufällige Gesamtstrukturen mit zufälligen Effekten vorgeschlagen wurden. Ist das in R möglich?
Ich bin mir nicht einmal sicher, ob die Frage wirklich Sinn macht, aber ich glaube, ich habe einige Titel von Artikeln gesehen, in denen zufällige Gesamtstrukturen mit zufälligen Effekten vorgeschlagen wurden. Ist das in R möglich?
Antworten:
Sie werden normalerweise nicht zusammen verwendet, und vor dem Kombinieren sollten Sie vorsichtig sein.
Als Klassifikatoren werden normalerweise zufällige Gesamtstrukturen verwendet. Der Grund dafür, dass Sie eine zufällige Gesamtstruktur anstelle einer anderen Methode verwenden würden (z. B. K-Mittel-Clustering), ist, dass Sie möglicherweise eine große Anzahl von Dimensionen haben, nach denen Sie klassifizieren möchten. Das Problem mit der großen Anzahl von Dimensionen ist, dass Sie, wenn Sie alle Kombinationen von Dimensionsreihenfolgen testen möchten, eine große Anzahl von Auswahlmöglichkeiten haben (diese wächst schneller als die Anzahl der Dimensionsfaktoren).
Zufällige Effekte werden in der Regel bei der Regression mit wiederholten Messungen derselben Sache verwendet. Sie werden häufig in Modellen mit gemischten Effekten verwendet, bei denen sich der Begriff „gemischt“ sowohl auf feste als auch auf zufällige Effekte bezieht. Es wird angenommen, dass die festgelegten Effekte die Parameter darstellen, die Sie wieder sehen werden (z. B. ein Medikament oder das Alter einer Person). Es wird angenommen, dass die zufälligen Effekte eine Variabilität um einen Parameter darstellen, den Sie nicht mehr sehen werden (z. B. eine bestimmte Person).
Es gibt Beispiele, die sie zusammen verwenden, wenn Clusterdaten vorliegen: http://dx.doi.org/10.1080/00949655.2012.741599 und http://www2.ims.nus.edu.sg/Programs/014swclass/files/denis.pdf .
Mir sind keine R-Pakete bekannt, die diese Analyse durchführen können.
Ja, das ist möglich. Sie sollten " RE-EM-Bäume: Ein Data Mining-Ansatz für Längs- und Clusterdaten " und das zugehörige R-Paket REEMtree lesen .
Es ist schon eine Weile her, seit ich auf die Zeitung geschaut habe. Ich erinnere mich, dass die Autoren noch nicht versucht hatten, Ensembles dieser Bäume zu bilden, aber nichts deutete darauf hin, dass es nicht funktionieren würde.
Mixed Effects Random Forests (MERFs) sind eine Sache. Wie die Antwort oben zeigt, gibt es einige großartige Nachforschungen von Dr. Larocques Gruppe an der HEC Montreal. Das Papier ist hier: http://www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599 .
Grundsätzlich ist es eine theoretisch sinnvolle Möglichkeit, die nichtlineare Modellierung zufälliger Wälder mit linearen Zufallseffekten zu kombinieren.
Wir haben gerade ein Open-Source-Paket in Python veröffentlicht , in dem MERF mithilfe des in diesem Artikel beschriebenen Algorithmus implementiert ist.
Wir haben einen detaillierten Blog-Beitrag über das Paket und seine Verwendung für Cluster-Datensätze geschrieben.