Ich habe LSTMs für eine Weile studiert. Ich verstehe auf hohem Niveau, wie alles funktioniert. Als ich sie jedoch mit Tensorflow implementieren wollte, bemerkte ich, dass BasicLSTMCell eine Reihe von Einheiten (dh num_units
) benötigt.
Aus dieser sehr gründlichen Erklärung von LSTMs habe ich herausgefunden, dass eine einzelne LSTM-Einheit eine der folgenden ist
Das ist eigentlich eine GRU-Einheit.
Ich gehe davon aus, dass sich der Parameter num_units
von auf die Anzahl dieser Parameter BasicLSTMCell
bezieht, die in einer Ebene miteinander verbunden werden sollen.
Da bleibt die Frage - was ist in diesem Zusammenhang eine "Zelle"? Entspricht eine "Zelle" einer Schicht in einem normalen neuronalen Feed-Forward-Netzwerk?