Gute Genauigkeit trotz hohem Verlustwert


15

Während des Trainings eines einfachen Binärklassifikators für neuronale Netze erhalte ich einen hohen Verlustwert unter Verwendung von Kreuzentropie. Trotzdem ist die Genauigkeit des Validierungssatzes recht gut. Hat es eine Bedeutung? Gibt es keine strikte Korrelation zwischen Verlust und Genauigkeit?

Ich habe auf Training und Validierung diese Werte: 0.4011 - acc: 0.8224 - val_loss: 0.4577 - val_acc: 0.7826 . Dies ist mein erster Versuch, ein NN zu implementieren, und ich habe mich gerade dem maschinellen Lernen zugewandt, sodass ich diese Ergebnisse nicht richtig auswerten kann.


3
Beobachten Sie einen hohen Verlustwert nur am Trainingsset oder auch an der Validierung? Gibt es einen großen Rückgang der Genauigkeit oder des Verlusts beim Vergleichen des Trainingssatzes und des Validierungssatzes? Einige Zahlen wären hilfreich
Hugh

Antworten:


20

Ich habe ein ähnliches Problem erlebt.

Ich habe meinen Binärklassifikator für neuronale Netze mit einem Kreuzentropieverlust trainiert. Hier das Ergebnis der Kreuzentropie als Funktion der Epoche. Rot ist für das Trainingsset und Blau ist für das Testset.

Kreuzentropie als Funktion der Epoche.

Durch das Zeigen der Genauigkeit hatte ich die Überraschung, eine bessere Genauigkeit für Epoche 1000 im Vergleich zu Epoche 50 zu erhalten, sogar für das Test-Set!

Genauigkeit in Abhängigkeit von der Epoche

Um die Zusammenhänge zwischen Kreuzentropie und Genauigkeit zu verstehen, habe ich mich mit einem einfacheren Modell befasst, der logistischen Regression (mit einer Eingabe und einer Ausgabe). Im Folgenden werde ich diese Beziehung nur in drei speziellen Fällen veranschaulichen.

Im Allgemeinen ist der Parameter, bei dem die Querentropie minimal ist, nicht der Parameter, bei dem die Genauigkeit maximal ist. Wir können jedoch eine gewisse Beziehung zwischen der Kreuzentropie und der Genauigkeit erwarten.

[Im Folgenden gehe ich davon aus, dass Sie wissen, was Kreuzentropie ist, warum wir sie anstelle von Genauigkeit verwenden, um das Modell zu trainieren usw. Wenn nicht, lesen Sie bitte zuerst Folgendes: Wie interpretieren Sie eine Kreuzentropie-Bewertung? ]

Abbildung 1 Hier soll gezeigt werden, dass der Parameter, bei dem die Kreuzentropie minimal ist, nicht der Parameter ist, bei dem die Genauigkeit maximal ist, und warum.

Hier sind meine Beispieldaten. Ich habe 5 Punkte und zum Beispiel hat Eingang -1 zu Ausgang 0 geführt. Stichprobe von 5 Punkten

Kreuzentropie. Nach Minimierung der Kreuzentropie erhalte ich eine Genauigkeit von 0,6. Der Schnitt zwischen 0 und 1 erfolgt bei x = 0,52. Für die 5 Werte erhalte ich jeweils eine Kreuzentropie von: 0,14, 0,30, 1,07, 0,97, 0,43.

Richtigkeit. Nachdem ich die Genauigkeit auf einem Gitter maximiert habe, erhalte ich viele verschiedene Parameter, die zu 0,8 führen. Dies kann direkt angezeigt werden, indem der Schnitt x = -0,1 gewählt wird. Nun, Sie können auch x = 0,95 auswählen, um die Sätze zu schneiden.

Im ersten Fall ist die Kreuzentropie groß. In der Tat ist der vierte Punkt weit vom Schnitt entfernt und weist eine große Kreuzentropie auf. Ich erhalte nämlich jeweils eine Kreuzentropie von: 0,01, 0,31, 0,47, 5,01, 0,004.

Im zweiten Fall ist auch die Kreuzentropie groß. In diesem Fall ist der dritte Punkt weit vom Schnitt entfernt und weist eine große Querentropie auf. Ich erhalte jeweils eine Kreuzentropie von: 5e-5, 2e-3, 4,81, 0,6, 0,6.

eineinbBeispiel für kleine Daten

n=100ein=0,3b=0,5

bbeinMittlerer Satz

ein

ein=0,3

n=10000ein=1b=0

Sehr große Datenmengen

Ich denke, wenn das Modell genug Kapazität hat (genug, um das wahre Modell aufzunehmen) und wenn die Daten groß sind (dh die Stichprobengröße wird unendlich), kann die Querentropie minimal sein, wenn die Genauigkeit maximal ist, zumindest für das logistische Modell . Ich habe keinen Beweis dafür, wenn jemand eine Referenz hat, bitte teilen.

Bibliografie: Das Thema, das Quertropie und Genauigkeit miteinander verbindet, ist interessant und komplex, aber ich kann keine Artikel finden, die sich damit befassen ... Genauigkeit zu studieren ist interessant, weil jeder seine Bedeutung verstehen kann, obwohl es sich um eine falsche Bewertungsregel handelt.

Hinweis: Zunächst möchte ich auf dieser Website eine Antwort finden. Es gibt zahlreiche Beiträge, die sich mit dem Zusammenhang zwischen Genauigkeit und Kreuzentropie befassen, aber nur wenige Antworten: Vergleichbare Traing- und Test-Kreuzentropien führen zu sehr unterschiedlichen Genauigkeiten . Validierungsverlust sinkt, aber Validierungsgenauigkeit verschlechtert sich ; Zweifel an der kategorialen Kreuzentropieverlustfunktion ; Logverlust als Prozentsatz interpretieren ...


Sehr gute Abbildungen. Inspiriert von diesen Abbildungen, schließe ich auf 2 mögliche Gründe. 1. Das Modell ist zu einfach, um die erforderlichen Funktionen für die Vorhersage zu extrahieren. In Ihrer Abbildung 1 ist dies ein vielfältiges Problem, und Sie müssen eine weitere Schicht hinzufügen, um eine 100% ige Genauigkeit zu erzielen.
Diansheng

-1

ahstat liefert sehr gute abbildungen.

Inspiriert von diesen Abbildungen, schließe ich auf 2 mögliche Gründe. 1. Das Modell ist zu einfach, um die erforderlichen Funktionen für die Vorhersage zu extrahieren. In Ihrer Abbildung 1 ist dies ein vielfältiges Problem, und Sie müssen eine weitere Schicht hinzufügen, um eine 100% ige Genauigkeit zu erzielen. 2. Daten haben zu viele verrauschte Beschriftungen (siehe Abbildung 1 und 3).

In Abbildung 2 wird erklärt, warum wir dem Modell nicht zu viel L1 / L2-Regularisierung hinzufügen können.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.