Ein wiederkehrendes neuronales Netzwerk (RNN) ist eine Klasse künstlicher neuronaler Netzwerke, bei denen Verbindungen zwischen Einheiten einen gerichteten Zyklus bilden.
Das Problem, mit dem ich mich beschäftige, ist die Vorhersage von Zeitreihenwerten. Ich betrachte jeweils eine Zeitreihe und möchte anhand von beispielsweise 15% der Eingabedaten deren zukünftige Werte vorhersagen. Bisher bin ich auf zwei Modelle gestoßen: LSTM (Long Short Term Memory; eine Klasse wiederkehrender neuronaler Netze) ARIMA Ich habe beide …
Ich versuche, etwas über RNNs zu lernen und verwende Keras. Ich verstehe die Grundvoraussetzung von Vanille-RNN- und LSTM-Schichten, habe jedoch Probleme, einen bestimmten technischen Punkt für das Training zu verstehen. In der Keras-Dokumentation heißt es, dass die Eingabe in eine RNN-Ebene eine Form haben muss (batch_size, timesteps, input_dim). Dies legt …
Wie viele Parameter hat ein einzelner gestapelter LSTM? Die Anzahl der Parameter legt eine Untergrenze für die Anzahl der erforderlichen Trainingsbeispiele fest und beeinflusst auch die Trainingszeit. Daher ist es für Trainingsmodelle mit LSTMs hilfreich, die Anzahl der Parameter zu kennen.
In letzter Zeit gibt es ein Papier zur Ebenennormalisierung . Es gibt auch eine Implementierung auf Keras. Aber ich erinnere mich, dass es Artikel mit dem Titel Recurrent Batch Normalization (Cooijmans, 2016) und Batch Normalized Recurrent Neural Networks (Laurent, 2015) gibt. Was ist der Unterschied zwischen diesen drei? Es gibt …
Vom Tensorflow-Code: Tensorflow. RnnCell. num_units: int, The number of units in the LSTM cell. Kann nicht verstehen, was das bedeutet. Was sind die Einheiten der LSTM-Zelle. Input, Output und vergessen Tore? Bedeutet dies "Anzahl der Einheiten in der wiederkehrenden Projektionsschicht für Deep LSTM". Warum heißt das dann "Anzahl der Einheiten …
Ich erstelle einen corr()DF aus einem Original-DF. Die corr()df herauskommen 70 X 70 , und es ist unmöglich , die Heatmap sichtbar zu machen ... sns.heatmap(df). Wenn ich versuche, das anzuzeigen corr = df.corr(), passt die Tabelle nicht auf den Bildschirm und ich kann alle Zusammenhänge sehen. Ist es eine …
Beim Lesen über die Texterzeugung mit wiederkehrenden neuronalen Netzen ist mir aufgefallen, dass einige Beispiele implementiert wurden, um Text Wort für Wort und andere Zeichen für Zeichen zu erzeugen, ohne dass tatsächlich angegeben wurde, warum. Was ist also der Unterschied zwischen RNN-Modellen, die Text pro Wort und Text pro Zeichen …
Ich versuche, ein neuronales Netzwerk mit Zeitreihen als Eingabe zu erstellen, um es basierend auf dem Typ jeder Reihe zu trainieren. Ich habe gelesen, dass man mit RNNs die Eingabe in Gruppen aufteilen und jeden Punkt der Zeitreihe in einzelne Neuronen aufteilen und schließlich das Netzwerk trainieren kann. Ich versuche …
Ich versuche, die Dimensionen der einzelnen Variablen in einer RNN in der Vergessen-Ebene herauszufinden, bin mir jedoch nicht sicher, ob ich auf dem richtigen Weg bin. Das nächste Bild und die folgende Gleichung stammen aus Colahs Blogpost "Understanding LSTM Networks" : wo: xtxtx_t ist die Eingabe desVektorsder Größem ∗ 1m∗1m*1 …
Ich habe Mühe, den Keras-Codierungsunterschied für die Eins-zu-Viele-Sequenzkennzeichnung (z. B. Klassifizierung einzelner Bilder) und die Viele-zu-Viele-Sequenzkennzeichnung (z. B. Klassifizierung von Bildsequenzen) zu interpretieren. Ich sehe häufig zwei verschiedene Arten von Codes: Bei Typ 1 wird kein TimeDistributed wie folgt angewendet: model=Sequential() model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1], border_mode="valid", input_shape=[1, 56,14])) model.add(Activation("relu")) model.add(Convolution2D(nb_filters, kernel_size[0], …
Ich habe versucht zu verstehen, wie man Daten darstellt und formt, um eine multidimentionale und multivariate Zeitreihenvorhersage mit Keras (oder TensorFlow) zu erstellen, aber ich bin immer noch sehr unklar, nachdem ich viele Blogposts / Tutorials / Dokumentationen gelesen habe, wie man die Daten im Internet präsentiert richtige Form (die …
Gibt es Faustregeln (oder tatsächliche Regeln) für die minimale, maximale und "angemessene" Anzahl von LSTM-Zellen, die ich verwenden sollte? Insbesondere beziehe ich mich auf BasicLSTMCell von TensorFlow und num_unitsEigenschaft. Bitte nehmen Sie an, dass ich ein Klassifizierungsproblem habe, das definiert ist durch: t - number of time steps n - …
Ich erstelle Prototypen für eine Anwendung und benötige ein Sprachmodell, um die Ratlosigkeit einiger generierter Sätze zu berechnen. Gibt es ein geschultes Sprachmodell in Python, das ich problemlos verwenden kann? So etwas Einfaches wie model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert …
Ist es bei Verwendung einer Mehrschicht LSTMmit Dropout ratsam, Dropout auf alle ausgeblendeten Ebenen sowie auf die Ausgabeebenen für dichte Ebenen zu setzen? In Hintons Artikel (der Dropout vorschlug) legte er Dropout nur auf die dichten Schichten, aber das lag daran, dass die verborgenen inneren Schichten faltungsmäßig waren. Natürlich kann …
Ich bin sehr neu in Deep Learning und ich bin besonders daran interessiert zu wissen, was LSTM und BiLSTM sind und wann ich sie verwenden soll (Hauptanwendungsbereiche). Warum sind LSTM und BILSTM beliebter als RNN? Können wir diese Deep-Learning-Architekturen bei unbeaufsichtigten Problemen verwenden?
Ich versuche, ein Gestenerkennungssystem zum Klassifizieren von ASL- Gesten (American Sign Language) zu erstellen. Daher soll meine Eingabe eine Folge von Bildern entweder von einer Kamera oder einer Videodatei sein, dann erkennt es die Folge und ordnet sie der entsprechenden zu Klasse (schlafen, helfen, essen, rennen usw.) Die Sache ist, …
Ich lerne, wie man Keras verwendet, und ich habe mit meinem beschrifteten Datensatz anhand der Beispiele in Chollets Deep Learning für Python vernünftigen Erfolg gehabt . Der Datensatz ist ~ 1000 Zeitreihen mit einer Länge von 3125 mit 3 möglichen Klassen. Ich möchte über die grundlegenden dichten Schichten hinausgehen, die …
Ich bin neu in ML und TensorFlow (ich habe vor ungefähr ein paar Stunden angefangen) und ich versuche, damit die nächsten Datenpunkte in einer Zeitreihe vorherzusagen. Ich nehme meinen Input und mache das damit: /----------- x ------------\ .-------------------------------. | 0 | 1 | 2 | 3 | 4 | 5 …
Ich möchte ANNs für mein Problem verwenden, aber das Problem ist, dass meine Ein- und Ausgabeknotennummern nicht behoben sind. Ich habe eine Google-Suche durchgeführt, bevor ich meine Frage gestellt habe, und festgestellt, dass der RNN mir bei meinem Problem helfen kann. Aber alle Beispiele, die ich gefunden habe, haben irgendwie …
Ich frage mich, wie man eine wiederkehrende Architektur in einem EEG-Kontext interpretiert. Insbesondere betrachte ich dies als wiederkehrendes CNN (im Gegensatz zu Architekturen wie LSTM), aber vielleicht gilt es auch für andere Arten von wiederkehrenden Netzwerken Wenn ich über R-CNNs lese, werden sie normalerweise in Bildklassifizierungskontexten erklärt. Sie werden typischerweise …
Ich habe ein beeindruckendes Ergebnis von LSTM-Modellen gesehen, die Shakespeare-ähnliche Texte produzieren. Ich habe mich gefragt, ob ein LSTM-Paket für R existiert. Ich habe danach gegoogelt, aber nur Pakete für Python und Julia gefunden. (Möglicherweise gibt es ein Leistungsproblem, das erklärt, warum diese Programme R vorgezogen werden.) Kennen Sie ein …
CNNs können Hunderte von verborgenen Ebenen aufweisen. Da sie häufig mit Bilddaten verwendet werden, wird durch die Verwendung vieler Ebenen die Komplexität erhöht. Soweit ich gesehen habe, haben RNNs normalerweise nur wenige Schichten, z. B. 2-4. Zum Beispiel habe ich bei der Klassifizierung von Elektrokardiogrammen (EKG) gesehen, dass Papiere LSTMs …
Ich habe kürzlich erfahren, wie ein neuronales Vanille-Netzwerk mit einer bestimmten Anzahl von Eingaben, versteckten Knoten und der gleichen Anzahl von Ausgaben wie Eingaben funktionieren würde. Ich habe mir verschiedene Beiträge angesehen, die sich jetzt auf wiederkehrende neuronale Netze beziehen, und ich verstehe das Konzept dahinter, aber ich verstehe bestimmte …
Ich frage mich, warum das Training von RNNs normalerweise nicht 100% der GPU verwendet. Wenn ich diesen RNN-Benchmark beispielsweise auf einem Maxwell Titan X unter Ubuntu 14.04.4 LTS x64 ausführe, liegt die GPU-Auslastung unter 90%: Der Benchmark wurde mit dem folgenden Befehl gestartet: python rnn.py -n 'fastlstm' -l 1024 -s …
Ich lese diesen Artikel "Sequence to Sequence Learning mit neuronalen Netzen" http://papers.nips.cc/paper/5346-sequence-to-sequence-learning-with-neural-networks.pdf Unter "2. Das Modell" steht: Das LSTM berechnet diese bedingte Wahrscheinlichkeit, indem es zuerst die feste dimensionale Darstellung v der Eingabesequenz (x1, ..., xT) erhält, die durch den letzten verborgenen Zustand des LSTM gegeben ist, und dann die …
Ich habe eine XMatrix, eine yVariable und eine andere Variable ORTHO_VAR. Ich muss die yVariable vorhersagen , wobei Xdie Vorhersagen aus diesem Modell orthogonal sein müssen, ORTHO_VARwährend sie so korreliert ywie möglich sind. Ich würde es vorziehen, wenn die Vorhersagen mit einer nicht parametrischen Methode wie erzeugt werden, xgboost.XGBRegressoraber ich …
Ich habe Wortbilder wie folgt: Nehmen wir an, es ist ein 256x64Bild. Mein Ziel ist es, den Text aus dem Bild zu extrahieren, 73791096754314441539wie es eine OCR im Grunde tut. Ich versuche ein Modell zu bauen, das Wörter aus Bildern erkennen kann. Wenn ich ein Wort sage, kann es eines …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.