Ich versuche, eine existierende Untersuchung zu finden, wie die Anzahl der verborgenen Schichten und die Größe dieser einer LSTM-basierten RNN ausgewählt werden kann.
Gibt es einen Artikel, in dem dieses Problem untersucht wird, dh wie viele Speicherzellen sollte man verwenden? Ich gehe davon aus, dass dies völlig von der Anwendung abhängt und in welchem Kontext das Modell verwendet wird, aber was sagt die Forschung aus?