Eine gebräuchliche Maßnahme zum Vergleich von zwei oder mehr Klassifizierungsmodellen besteht darin, die Fläche unter der ROC-Kurve (AUC) als Mittel zur indirekten Bewertung ihrer Leistung zu verwenden. In diesem Fall wird ein Modell mit einer größeren AUC normalerweise als leistungsstärker interpretiert als ein Modell mit einer kleineren AUC. Laut Vihinen, 2012 ( https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3303716/ ) ist ein solcher Vergleich nicht mehr gültig, wenn sich beide Kurven kreuzen. Wieso ist es so?
Was kann man zum Beispiel an den Modellen A, B und C anhand der ROC-Kurven und der folgenden AUCs feststellen?