Ist es möglich, die Kosten einer Fehlklassifizierung im R-Paket randomForest zu kontrollieren ?
In meiner eigenen Arbeit sind falsch negative Ergebnisse (z. B. das Fehlen einer Krankheit) weitaus kostspieliger als falsch positive Ergebnisse. Das Paket rpart ermöglicht es dem Benutzer, Fehlklassifizierungskosten zu kontrollieren, indem eine Verlustmatrix angegeben wird, um Fehlklassifizierungen unterschiedlich zu gewichten. Gibt es etwas ähnliches für randomForest
? Soll ich zum Beispiel die classwt
Option verwenden, um das Gini-Kriterium zu steuern?
classwt
: Ja, ich habe festgestellt, dass die Ergebnisse in der Praxis und im Einklang mit anderen Benutzern nicht den Erwartungen entsprechen. (iii)cutoff
: Mir ist nicht klar, wiecutoff
ich in diesem Fall vorgehen soll, und ich würde jeden weiteren Rat begrüßen.