Ich habe Daten mit einigen tausend Features und möchte eine rekursive Feature-Auswahl (RFE) durchführen, um nicht informative zu entfernen. Ich mache das mit Caret und RFE. Ich begann jedoch zu überlegen, wann ich die Parameterabstimmung ( mtryfür RF) durchführen soll, wenn ich die beste Regressionsanpassung erhalten möchte (z. B. zufällige Gesamtstruktur). Das heißt, wie ich verstehe, trainiert Caret wiederholt RF auf verschiedenen Feature-Subsets mit einem festen Mtry. Ich nehme an, das Optimum mtrysollte gefunden werden, nachdem die Merkmalsauswahl abgeschlossen ist. Wird der von Caret verwendete mtryWert die ausgewählte Teilmenge von Merkmalen beeinflussen? Die Verwendung von Caret mit Low ist natürlich viel schneller.mtry
Hoffe jemand kann mir das erklären.