Antworten:
Erstens sollten wir uns auf die rechte Seite des Diagramms konzentrieren, wo es genügend Daten für die Auswertung gibt.
Wenn zwei Kurven "nahe beieinander" sind und beide eine niedrige Punktzahl haben. Das Modell leidet unter einem Anpassungsproblem (hohe Abweichung)
Wenn die Trainingskurve eine viel bessere Punktzahl aufweist, die Testkurve jedoch eine geringere Punktzahl aufweist, dh es gibt große Lücken zwischen zwei Kurven. Dann leidet das Modell an einem Überpassungsproblem (hohe Varianz)
Aus der Handlung ist es schwer zu sagen, ob das Modell gut ist oder nicht. Es ist möglich, dass Sie ein wirklich "einfaches Problem" haben, ein gutes Modell kann 90% erreichen. Andererseits ist es möglich, dass Sie ein wirklich "schweres Problem" haben, dass das Beste, was wir tun können, darin besteht, 70% zu erreichen. (Beachten Sie, dass Sie möglicherweise nicht erwarten, dass Sie ein perfektes Modell haben. Die Punktzahl ist 1. Wie viel Sie erreichen können, hängt davon ab, wie viel Rauschen in Ihren Daten auftritt. Angenommen, Ihre Daten enthalten viele Datenpunkte mit der Funktion EXACT, aber mit unterschiedlichen Bezeichnungen. egal was du tust, du kannst keine 1 in der Punktzahl erreichen.)
Ein weiteres Problem in Ihrem Beispiel ist, dass 350 Beispiele in einer realen Anwendung zu klein erscheinen.
Um ein besseres Verständnis zu erhalten, können Sie die folgenden Experimente durchführen, um eine Überanpassung zu erfahren und zu beobachten, was in der Lernkurve passieren wird.
Wählen Sie sehr komplizierte Daten aus, beispielsweise MNIST-Daten, und passen Sie sie an ein einfaches Modell an, beispielsweise ein lineares Modell mit einem Feature.
Wählen Sie einfache Daten aus, z. B. Iris-Daten, die zu einem Komplexitätsmodell passen, z. B. SVM.
Zusätzlich werde ich zwei Beispiele geben, die sich auf Unter- und Überanpassung beziehen. Beachten Sie, dass dies keine Lernkurve ist, sondern die Leistung in Bezug auf die Anzahl der Iterationen im Gradientenverstärkungsmodell , bei dem mehr Iterationen eine höhere Wahrscheinlichkeit für eine Überanpassung haben. Die x-Achse zeigt die Anzahl der Iterationen, und die y-Achse zeigt die Leistung, die negativ ist. Fläche unter ROC (je niedriger, desto besser.)
Die linke Nebenhandlung leidet nicht unter Überanpassung (auch nicht unteranpassung, da die Leistung einigermaßen gut ist), während die rechte Unterhandlung unter Überanpassung leidet, wenn die Anzahl der Iterationen groß ist.