Ich bin ein Anfänger, der versucht, mein erstes Projekt zusammenzustellen. Ich hatte ein Songklassifizierungsprojekt im Sinn, aber da ich manuell beschriften würde, könnte ich nur 1000 Songs oder 60 Stunden Musik vernünftigerweise zusammenstellen.
Ich würde mit mehreren Klassen klassifizieren, daher ist es möglich, dass eine Klasse nur 50-100 Songs im Trainingsset hat - das scheint zu wenig! Gibt es eine allgemeine Faustregel dafür, wie viele Daten benötigt werden, um ein neuronales Netzwerk zu trainieren, damit es funktioniert?
Edit: Ich habe überlegt, einen Vanille-LSTM zu verwenden. Die Eingabe-Features haben die Dimension 39 und die Ausgabedimension 6. Mein erster Versuch für die Dimension für ausgeblendete Layer ist 100.