Als «deep-learning» getaggte Fragen

Deep Learning ist ein Bereich des maschinellen Lernens, dessen Ziel es ist, komplexe Funktionen mithilfe spezieller neuronaler Netzwerkarchitekturen zu lernen, die "tief" sind (aus vielen Schichten bestehen). Dieses Tag sollte für Fragen zur Implementierung von Deep-Learning-Architekturen verwendet werden. Allgemeine Fragen zum maschinellen Lernen sollten mit "Maschinelles Lernen" gekennzeichnet sein. Das Einfügen eines Tags für die entsprechende Softwarebibliothek (z. B. "Keras", "Tensorflow", "Pytorch", "Fast.ai" usw.) ist hilfreich.






6
Verwenden einer vorab trainierten Worteinbettung (word2vec oder Glove) in TensorFlow
Ich habe kürzlich eine interessante Implementierung für die Klassifizierung von Faltungstexten überprüft . Alle von mir überprüften TensorFlow-Codes verwenden jedoch zufällige (nicht vorab trainierte) Einbettungsvektoren wie die folgenden: with tf.device('/cpu:0'), tf.name_scope("embedding"): W = tf.Variable( tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0), name="W") self.embedded_chars = tf.nn.embedding_lookup(W, self.input_x) self.embedded_chars_expanded = tf.expand_dims(self.embedded_chars, -1) Weiß jemand, wie …

10
Wie füge ich Regularisierungen in TensorFlow hinzu?
Ich habe in vielen verfügbaren neuronalen Netzwerkcodes, die mit TensorFlow implementiert wurden, festgestellt, dass Regularisierungsterme häufig durch manuelles Hinzufügen eines zusätzlichen Terms zum Verlustwert implementiert werden. Meine Fragen sind: Gibt es eine elegantere oder empfohlene Art der Regularisierung als die manuelle? Ich finde auch, dass get_variabledas ein Argument hat regularizer. …

6
PyTorch - zusammenhängend ()
Ich habe dieses Beispiel eines LSTM-Sprachmodells auf Github (Link) durchgearbeitet . Was es im Allgemeinen macht, ist mir ziemlich klar. Aber ich habe immer noch Schwierigkeiten zu verstehen, was das Aufrufen contiguous()bewirkt, was im Code mehrmals vorkommt. Beispielsweise werden in Zeile 74/75 der Codeeingabe und Zielsequenzen des LSTM erstellt. Daten …

5
Was ist die Verwendung von verbose in Keras bei der Validierung des Modells?
Ich verwende das LSTM-Modell zum ersten Mal. Hier ist mein Modell: opt = Adam(0.002) inp = Input(...) print(inp) x = Embedding(....)(inp) x = LSTM(...)(x) x = BatchNormalization()(x) pred = Dense(5,activation='softmax')(x) model = Model(inp,pred) model.compile(....) idx = np.random.permutation(X_train.shape[0]) model.fit(X_train[idx], y_train[idx], nb_epoch=1, batch_size=128, verbose=1) Was nützt es wortreich beim Trainieren des Modells?

4
Was bedeutet global_step in Tensorflow?
In diesem Tutorial-Code von der TensorFlow-Website, könnte jemand helfen zu erklären, was global_stepbedeutet? Ich habe auf der Tensorflow-Website geschrieben, dass ein globaler Schritt verwendet wird, um Trainingsschritte zu zählen , aber ich verstehe nicht ganz, was genau das bedeutet. Was bedeutet die Zahl 0 beim Einrichten global_step? def training(loss,learning_rate): tf.summary.scalar('loss',loss) …



5
Häufige Ursachen für Nans während des Trainings
Ich habe festgestellt, dass ein häufiges Auftreten während des Trainings NANeingeführt wird. Oft scheint es durch Gewichte in inneren Produkt- / vollständig verbundenen oder Faltungsschichten, die explodieren, eingeführt zu werden. Tritt dies auf, weil die Gradientenberechnung explodiert? Oder liegt es an der Gewichtsinitialisierung (wenn ja, warum hat die Gewichtsinitialisierung diesen …

1
Welche Rolle spielt die TimeDistributed-Ebene in Keras?
Ich versuche zu verstehen, was der TimeDistributed-Wrapper in Keras macht. Ich verstehe, dass TimeDistributed "eine Ebene auf jede zeitliche Schicht einer Eingabe anwendet". Aber ich habe einige Experimente durchgeführt und die Ergebnisse erhalten, die ich nicht verstehen kann. Kurz gesagt, in Verbindung mit der LSTM-Schicht erzielen TimeDistributed und Just Dense …

4
Wie entpacke ich eine pkl-Datei?
Ich habe eine pkl-Datei aus dem MNIST-Datensatz, die aus handgeschriebenen Ziffernbildern besteht. Ich möchte mir jedes dieser Ziffernbilder ansehen, daher muss ich die pkl-Datei entpacken, außer ich kann nicht herausfinden, wie. Gibt es eine Möglichkeit, pkl-Dateien zu entpacken / entpacken?

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.