Wie jede Metrik ist eine gute Metrik die bessere als die "blöde", zufällige Vermutung, wenn Sie keine Informationen zu den Beobachtungen erraten müssten. Dies wird in der Statistik als Intercept-Only-Modell bezeichnet.
Diese "dumme" Vermutung hängt von 2 Faktoren ab:
- die Anzahl der Klassen
- das Gleichgewicht der Klassen: ihre Prävalenz im beobachteten Datensatz
Im Fall der LogLoss-Metrik ist eine übliche "bekannte" Metrik, dass 0,693 der nicht informative Wert ist. Diese Zahl wird durch Vorhersagen p = 0.5
für jede Klasse eines binären Problems erhalten. Dies gilt nur für ausgeglichene Binärprobleme . Denn wenn die Prävalenz einer Klasse 10% beträgt, werden Sie dies immer p =0.1
für diese Klasse vorhersagen . Dies wird Ihre Grundlage für dumme, zufällige Vorhersagen sein, weil Vorhersagen0.5
dümmer sein werden.
I. Einfluss der Klassenanzahl N
auf den Dummkopfverlust:
Im ausgeglichenen Fall (jede Klasse hat die gleiche Prävalenz) lautet p = prevalence = 1 / N
die Gleichung , wenn Sie für jede Beobachtung vorhersagen , einfach:
Logloss = -log(1 / N)
log
Sein Ln
, neperianischer Logarithmus für diejenigen, die diese Konvention verwenden.
Im binären Fall N = 2
:Logloss = - log(1/2) = 0.693
Die dummen Loglosses sind also folgende:
II. Einfluss der Klassenprävalenz auf den dummen Logloss:
ein. Fall der binären Klassifizierung
In diesem Fall sagen wir immer voraus p(i) = prevalence(i)
und erhalten die folgende Tabelle:
Wenn die Klassen sehr unausgewogen sind (Prävalenz <2%), kann ein logarithmischer Verlust von 0,1 sehr schlecht sein! Eine Genauigkeit von 98% wäre in diesem Fall schlecht. Vielleicht wäre Logloss nicht die beste Metrik
b. Fall mit drei Klassen
"Dumm" -Logloss je nach Prävalenz - Dreiklassenfall:
Wir können hier die Werte von ausgeglichenen Binär- und Dreiklassenfällen (0,69 und 1,1) sehen.
FAZIT
Ein logarithmischer Verlust von 0,69 kann in einem Problem mit mehreren Klassen gut und in einem binär voreingenommenen Fall sehr schlecht sein.
Abhängig von Ihrem Fall sollten Sie sich die Grundlinie des Problems selbst berechnen, um die Bedeutung Ihrer Vorhersage zu überprüfen.
In den voreingenommenen Fällen hat logloss meines Wissens das gleiche Problem wie die Genauigkeit und andere Verlustfunktionen: Es bietet nur eine globale Messung Ihrer Leistung. Daher sollten Sie Ihr Verständnis besser mit Kennzahlen ergänzen, die sich auf die Minderheitsklassen konzentrieren (Rückruf und Genauigkeit) oder Logloss überhaupt nicht verwenden.