Ich habe gerade das Lesen dieses Diskussion . Sie argumentieren, dass PR AUC bei unausgeglichenen Datensätzen besser ist als ROC AUC.
Zum Beispiel haben wir 10 Proben im Testdatensatz. 9 Proben sind positiv und 1 ist negativ. Wir haben ein schreckliches Modell, das alles Positive vorhersagt. Wir haben also eine Metrik, die TP = 9, FP = 1, TN = 0, FN = 0 ist.
Dann ist Präzision = 0,9, Rückruf = 1,0. Die Präzision und der Rückruf sind beide sehr hoch, aber wir haben einen schlechten Klassifikator.
Andererseits ist TPR = TP / (TP + FN) = 1,0, FPR = FP / (FP + TN) = 1,0. Da der FPR sehr hoch ist, können wir feststellen, dass dies kein guter Klassifikator ist.
Bei unausgeglichenen Datensätzen ist ROC eindeutig besser als PR. Kann jemand erklären, warum PR besser ist?