Ich habe mit zufälligen Wäldern für die Regression herumgespielt und habe Schwierigkeiten, genau herauszufinden, was die beiden wichtigen Maße bedeuten und wie sie interpretiert werden sollten.
Die importance()Funktion gibt für jede Variable zwei Werte an: %IncMSEund IncNodePurity. Gibt es einfache Interpretationen für diese 2 Werte?
Ist dies IncNodePurityinsbesondere einfach der Betrag, den der RSS nach dem Entfernen dieser Variablen erhöht?
?importance? Es gibt eine Erklärung, was beide Maßnahmen bedeuten ...