Ich habe mit zufälligen Wäldern für die Regression herumgespielt und habe Schwierigkeiten, genau herauszufinden, was die beiden wichtigen Maße bedeuten und wie sie interpretiert werden sollten.
Die importance()
Funktion gibt für jede Variable zwei Werte an: %IncMSE
und IncNodePurity
. Gibt es einfache Interpretationen für diese 2 Werte?
Ist dies IncNodePurity
insbesondere einfach der Betrag, den der RSS nach dem Entfernen dieser Variablen erhöht?
?importance
? Es gibt eine Erklärung, was beide Maßnahmen bedeuten ...