Zunächst haben wir eine Klassifizierungsaufgabe.
Daher verwenden wir zur Klassifizierung die typische Softmax-Kreuzentropie.
Die derzeitige Implementierung des Lehrplanlernens ist wie folgt.
- Zuerst trainieren wir unsere beste Version des neuronalen Netzes
- In der letzten Epoche erhalten wir alle Kreuzentropien für alle Instanzen. So werden kleinere Kreuzentropien besser klassifiziert und größere nicht so gut.
- Dann sortieren wir die Instanzen basierend auf den Kreuzentropien.
- Dann fangen wir an, die Instanzen von einfacher zu schwieriger zu trainieren, wie es die Theorie des Lehrplanlernens vorschlägt
Beachten Sie, dass wir bereits mit verschiedenen Schritten und Wiederholungen experimentiert haben. In einem Beispiel haben wir die ersten 200 Chargen genommen und sie zweimal trainiert, bevor wir zur nächsten Charge übergingen und so weiter, bis eine Epoche abgeschlossen ist.
In einem anderen Beispiel haben wir die ersten 10 Chargen genommen und sie nur einmal trainiert und dann die nächsten 10 und die nächsten 10 und so weiter bis zum Ende der Epoche.
Alle bisherigen Experimente haben ergeben, dass das neuronale Netzwerk zu Beginn eine relativ gute Genauigkeit aufweist, und dies verschlechtert sich, wenn die schwierigeren Instanzen auftreten. Die endgültige Genauigkeit ist viel schlechter als erwartet und außerdem ist die maximale Genauigkeit immer noch ziemlich schlecht.
Warum funktioniert dieses Lehrplanlernen nicht? Fehlt etwas?