LSTM steht für Long Short-Term Memory. Wenn wir diesen Begriff die meiste Zeit verwenden, beziehen wir uns auf ein wiederkehrendes neuronales Netzwerk oder einen Block (Teil) eines größeren Netzwerks.
In diesem Link zu Stationarität und Differenzierung wurde erwähnt, dass Modelle wie ARIMA eine stationäre Zeitreihe für die Vorhersage benötigen, da ihre statistischen Eigenschaften wie Mittelwert, Varianz, Autokorrelation usw. über die Zeit konstant sind. Da RNNs besser in der Lage sind, nichtlineare Beziehungen zu lernen ( wie hier angegeben: Das …
LSTMWie ist es möglich , ein Netzwerk zu schreiben und es mit unterschiedlichen Eingangsarraygrößen zu versorgen? Zum Beispiel möchte ich Sprach- oder Textnachrichten in einer anderen Sprache erhalten und übersetzen. Die erste Eingabe ist vielleicht "Hallo", aber die zweite ist "Wie geht es dir?". Wie kann ich ein Design entwerfen …
Wird mein LSTM überarbeitet, wenn ich es mit dem Schiebefenster trainiere? Warum scheinen die Leute es nicht für LSTMs zu verwenden? Für ein vereinfachtes Beispiel nehmen wir an, dass wir die Zeichenfolge vorhersagen müssen: A B C D E F G H I J K L M N O P …
Ich habe Mühe, den Keras-Codierungsunterschied für die Eins-zu-Viele-Sequenzkennzeichnung (z. B. Klassifizierung einzelner Bilder) und die Viele-zu-Viele-Sequenzkennzeichnung (z. B. Klassifizierung von Bildsequenzen) zu interpretieren. Ich sehe häufig zwei verschiedene Arten von Codes: Bei Typ 1 wird kein TimeDistributed wie folgt angewendet: model=Sequential() model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1], border_mode="valid", input_shape=[1, 56,14])) model.add(Activation("relu")) model.add(Convolution2D(nb_filters, kernel_size[0], …
Ich habe ein LSTM-Modell erstellt, um doppelte Fragen im offiziellen Quora-Datensatz vorherzusagen. Die Testetiketten sind 0 oder 1. 1 zeigt an, dass das Fragenpaar doppelt vorhanden ist. Nachdem model.fitich das Modell mit erstellt habe , teste ich das Modell anhand model.predictder Testdaten. Die Ausgabe ist ein Array von Werten wie …
Ich habe versucht zu verstehen, wie man Daten darstellt und formt, um eine multidimentionale und multivariate Zeitreihenvorhersage mit Keras (oder TensorFlow) zu erstellen, aber ich bin immer noch sehr unklar, nachdem ich viele Blogposts / Tutorials / Dokumentationen gelesen habe, wie man die Daten im Internet präsentiert richtige Form (die …
Ich erweitere mein Wissen über das Keras-Paket und habe mit einigen der verfügbaren Modelle gearbeitet. Ich habe ein NLP-Binärklassifizierungsproblem, das ich zu lösen versuche, und wende verschiedene Modelle an. Nachdem ich mit einigen Ergebnissen gearbeitet und mehr und mehr über LSTM gelesen habe, scheint es, als ob dieser Ansatz allem …
Gibt es eine Methode zur Berechnung des Vorhersageintervalls (Wahrscheinlichkeitsverteilung) um eine Zeitreihenprognose aus einem LSTM-Netzwerk (oder einem anderen wiederkehrenden neuronalen Netzwerk)? Angenommen, ich prognostiziere 10 Stichproben für die Zukunft (t + 1 bis t + 10), basierend auf den letzten 10 beobachteten Stichproben (t-9 bis t), würde ich erwarten, dass …
Ich erstelle Prototypen für eine Anwendung und benötige ein Sprachmodell, um die Ratlosigkeit einiger generierter Sätze zu berechnen. Gibt es ein geschultes Sprachmodell in Python, das ich problemlos verwenden kann? So etwas Einfaches wie model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert …
Ist es bei Verwendung einer Mehrschicht LSTMmit Dropout ratsam, Dropout auf alle ausgeblendeten Ebenen sowie auf die Ausgabeebenen für dichte Ebenen zu setzen? In Hintons Artikel (der Dropout vorschlug) legte er Dropout nur auf die dichten Schichten, aber das lag daran, dass die verborgenen inneren Schichten faltungsmäßig waren. Natürlich kann …
Ich bin sehr neu in Deep Learning und ich bin besonders daran interessiert zu wissen, was LSTM und BiLSTM sind und wann ich sie verwenden soll (Hauptanwendungsbereiche). Warum sind LSTM und BILSTM beliebter als RNN? Können wir diese Deep-Learning-Architekturen bei unbeaufsichtigten Problemen verwenden?
Ich versuche, ein Gestenerkennungssystem zum Klassifizieren von ASL- Gesten (American Sign Language) zu erstellen. Daher soll meine Eingabe eine Folge von Bildern entweder von einer Kamera oder einer Videodatei sein, dann erkennt es die Folge und ordnet sie der entsprechenden zu Klasse (schlafen, helfen, essen, rennen usw.) Die Sache ist, …
Ich lerne, wie man Keras verwendet, und ich habe mit meinem beschrifteten Datensatz anhand der Beispiele in Chollets Deep Learning für Python vernünftigen Erfolg gehabt . Der Datensatz ist ~ 1000 Zeitreihen mit einer Länge von 3125 mit 3 möglichen Klassen. Ich möchte über die grundlegenden dichten Schichten hinausgehen, die …
Ich versuche zu lernen, wie LSTMNetzwerke funktionieren, und selbst wenn ich die Grundlagen verstehe, sind mir die Details der internen Struktur nicht klar. Auf diesem Blog- Link habe ich dieses Schema einer LSTMArchitektur gefunden Wo anscheinend jeder Kreis einer einzelnen LSTMEinheit wie dieser entsprechen sollte Ist das richtig? Ist jede …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.