Die Frage ist ziemlich vage, daher gehe ich davon aus, dass Sie ein geeignetes Leistungsmaß auswählen möchten, um verschiedene Modelle zu vergleichen. Einen guten Überblick über die wichtigsten Unterschiede zwischen ROC- und PR-Kurven finden Sie in folgendem Artikel : Die Beziehung zwischen Precision- Recall- und ROC-Kurven von Davis und Goadrich .
Um Davis und Goadrich zu zitieren:
Bei stark verzerrten Datensätzen geben Precision-Recall-Kurven (PR-Kurven) jedoch ein aussagekräftigeres Bild der Leistung eines Algorithmus.
ROC-Kurvendiagramm FPR gegen TPR. :
PR-Kurven zeichnen Präzision gegen Rückruf (FPR) oder genauer:
FPR = FPFP+ TN,TPR = TPTP+ FN.
r e c a l l = TPTP+FN= TPR ,p r e c i s i o n = TPTP+FP
Die Präzision wird direkt vom Klassengleichgewicht beeinflusst, da betroffen ist, wohingegen TPR nur von Positiven abhängt. Aus diesem Grund erfassen ROC-Kurven solche Effekte nicht.FP
Precision-Recall-Kurven sind besser, um Unterschiede zwischen Modellen für stark unausgeglichene Datensätze hervorzuheben. Wenn Sie verschiedene Modelle in unausgeglichenen Einstellungen vergleichen möchten, weist der Bereich unter der PR-Kurve wahrscheinlich größere Unterschiede als der Bereich unter der ROC-Kurve auf.
Allerdings sind ROC-Kurven viel häufiger (auch wenn sie weniger geeignet sind). Abhängig von Ihrer Zielgruppe können ROC-Kurven die Verkehrssprache sein. Daher ist die Verwendung dieser Kurven wahrscheinlich die sicherere Wahl. Wenn ein Modell ein anderes Modell im PR-Bereich vollständig dominiert (z. B. immer eine höhere Genauigkeit über den gesamten Rückrufbereich), dominiert es auch im ROC-Bereich. Wenn sich die Kurven in einem Raum kreuzen, kreuzen sie sich auch im anderen. Mit anderen Worten, die wichtigsten Schlussfolgerungen sind ähnlich, unabhängig davon, welche Kurve Sie verwenden.
Schamlose Werbung . Als zusätzliches Beispiel können Sie sich eine meiner Arbeiten ansehen , in denen ich sowohl ROC- als auch PR-Kurven in einem unausgeglichenen Umfeld berichte. Abbildung 3 enthält ROC- und PR-Kurven für identische Modelle, die den Unterschied zwischen beiden deutlich zeigen. Um den Bereich unter PR mit dem Bereich unter ROC zu vergleichen, können Sie die Tabellen 1-2 (AUPR) und 3-4 (AUROC) vergleichen, wobei Sie sehen, dass AUPR zwischen einzelnen Modellen viel größere Unterschiede aufweist als AUROC. Dies unterstreicht noch einmal die Eignung von PR-Kurven.