In der gesamten Literatur zur Modellierung der Artenverteilung wird vorgeschlagen, dass bei der Vorhersage des Vorhandenseins / Nichtvorhandenseins einer Art unter Verwendung eines Modells, das Wahrscheinlichkeiten (z. B. RandomForests) ausgibt, die Wahl der Schwellenwahrscheinlichkeit, nach der eine Art tatsächlich als Vorhandensein oder Nichtvorhandensein klassifiziert werden soll, wichtig ist und sollte Verlassen Sie sich nicht immer auf den Standardwert von 0,5. Ich brauche Hilfe dabei! Hier ist mein Code:
library(randomForest)
library(PresenceAbsence)
#build model
RFfit <- randomForest(Y ~ x1 + x2 + x3 + x4 + x5, data=mydata, mytry = 2, ntrees=500)
#eventually I will apply this to (predict for) new data but for first I predict back to training data to compare observed vs. predicted
RFpred <- predict(RFfit, mydata, type = "prob")
#put the observed vs. predicted in the same dataframe
ObsPred <- data.frame(cbind(mydata), Predicted=RFpred)
#create auc.roc plot
auc.roc.plot(ObsPred, threshold = 10, xlab="1-Specificity (false positives)",
ylab="Sensitivity (true positives)", main="ROC plot", color=TRUE,
find.auc=TRUE, opt.thresholds=TRUE, opt.methods=9)
Daraus ermittelte ich, dass der Schwellenwert, den ich zur Klassifizierung der Anwesenheit anhand der vorhergesagten Wahrscheinlichkeiten verwenden möchte, 0,7 beträgt, nicht der Standardwert von 0,5. Ich verstehe nicht ganz, was ich mit diesen Informationen anfangen soll. Benutze ich diesen Schwellenwert einfach, wenn ich eine Karte meiner Ausgabe erstelle? Ich könnte leicht eine zugeordnete Ausgabe mit kontinuierlichen Wahrscheinlichkeiten erstellen und dann einfach diejenigen mit Werten größer als 0,7 als vorhanden und diejenigen <0,7 als nicht vorhanden neu klassifizieren.
Oder möchte ich diese Informationen verwenden und meine randomForests-Modellierung mithilfe des Cut-Off-Parameters erneut ausführen? Was genau macht der Cut-Off-Parameter? Ändert es die resultierende Abstimmung? (sagt derzeit, es ist "Mehrheit"). Wie verwende ich diesen Grenzparameter? Ich verstehe die Dokumentation nicht! Vielen Dank!