Programmierung deep-learning

13

Epoche gegen Iteration beim Training neuronaler Netze

Was ist der Unterschied zwischen Epoche und Iteration beim Training eines mehrschichtigen Perzeptrons?

412 machine-learning neural-network deep-learning artificial-intelligence terminology

3

Ich versuche mein Verständnis von LSTMs in Einklang zu bringen und habe hier in diesem Beitrag von Christopher Olah , der in Keras implementiert wurde, darauf hingewiesen . Ich folge dem Blog von Jason Brownlee für das Keras-Tutorial. Was mich hauptsächlich verwirrt ist, ist: Die Umformung der Datenreihen in [samples, …

311 python deep-learning keras lstm

15

Was ist der Unterschied zwischen 'SAME' und 'VALID' in tf.nn.max_pool von Tensorflow?

Was ist der Unterschied zwischen ‚SAMT‘ und ‚VALID‘ padding in tf.nn.max_poolder tensorflow? Meiner Meinung nach bedeutet "GÜLTIG", dass es außerhalb der Kanten keine Null-Polsterung gibt, wenn wir den Max-Pool ausführen. Laut einem Leitfaden zur Faltungsarithmetik für tiefes Lernen heißt es, dass der Poolbetreiber keine Polsterung aufweist, dh verwenden Sie einfach …

309 python tensorflow deep-learning

2

Erklärung der Keras-Eingabe: Eingabeform, Einheiten, Stapelgröße, Dim usw.

Für jede Keras Schicht ( LayerKlasse), erklären kann jemand wie man den Unterschied zwischen verstehen input_shape, units, dimetc.? In der Dokumentation heißt es beispielsweise units, die Ausgabeform einer Ebene anzugeben. Im Bild des neuronalen Netzes unten hidden layer1hat 4 Einheiten. Wird dies direkt auf das unitsAttribut des LayerObjekts übertragen? Oder …

262 neural-network deep-learning keras keras-layer tensor

11

Was bedeuten die Wortprotokolle in TensorFlow?

In der folgenden TensorFlow-Funktion müssen wir die Aktivierung künstlicher Neuronen in der letzten Schicht füttern. Das verstehe ich. Aber ich verstehe nicht, warum es Logits heißt? Ist das nicht eine mathematische Funktion? loss_function = tf.nn.softmax_cross_entropy_with_logits( logits = last_layer, labels = target_output )

250 tensorflow machine-learning neural-network deep-learning cross-entropy

3

Wie man "Verlust" und "Genauigkeit" für ein Modell des maschinellen Lernens interpretiert

Wenn ich mein neuronales Netzwerk mit Theano oder Tensorflow trainiert habe, wird pro Epoche eine Variable namens "Verlust" gemeldet. Wie soll ich diese Variable interpretieren? Ein höherer Verlust ist besser oder schlechter, oder was bedeutet dies für die endgültige Leistung (Genauigkeit) meines neuronalen Netzwerks?

200 machine-learning neural-network mathematical-optimization deep-learning objective-function

5

Der beste Weg, um ein trainiertes Modell in PyTorch zu speichern?

Ich suchte nach alternativen Möglichkeiten, um ein trainiertes Modell in PyTorch zu speichern. Bisher habe ich zwei Alternativen gefunden. torch.save () zum Speichern eines Modells und torch.load () zum Laden eines Modells. model.state_dict () zum Speichern eines trainierten Modells und model.load_state_dict () zum Laden des gespeicherten Modells. Ich bin auf …

187 python serialization deep-learning pytorch tensor

11

Warum bieten binäre Kreuzentropie und kategoriale Kreuzentropie unterschiedliche Leistungen für dasselbe Problem?

Ich versuche, ein CNN zu trainieren, um Text nach Themen zu kategorisieren. Wenn ich binäre Kreuzentropie verwende, erhalte ich eine Genauigkeit von ~ 80%, bei kategorialer Kreuzentropie eine Genauigkeit von ~ 50%. Ich verstehe nicht, warum das so ist. Es ist ein Problem mit mehreren Klassen. Bedeutet das nicht, dass …

159 machine-learning keras neural-network deep-learning conv-neural-network

8

Was macht die Funktion tf.nn.embedding_lookup?

tf.nn.embedding_lookup(params, ids, partition_strategy='mod', name=None) Ich kann die Pflicht dieser Funktion nicht verstehen. Ist es wie eine Nachschlagetabelle? Was bedeutet, die Parameter zurückzugeben, die jeder ID entsprechen (in IDs)? skip-gramWenn wir zum Beispiel im Modell verwenden tf.nn.embedding_lookup(embeddings, train_inputs), findet es dann für jedes train_inputdie entsprechende Einbettung?

158 python tensorflow deep-learning word-embedding natural-language-processing

10

Keras, wie bekomme ich die Ausgabe jeder Schicht?

Ich habe ein binäres Klassifizierungsmodell mit CNN trainiert und hier ist mein Code model = Sequential() model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1], border_mode='valid', input_shape=input_shape)) model.add(Activation('relu')) model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1])) model.add(Activation('relu')) model.add(MaxPooling2D(pool_size=pool_size)) # (16, 16, 32) model.add(Convolution2D(nb_filters*2, kernel_size[0], kernel_size[1])) model.add(Activation('relu')) model.add(Convolution2D(nb_filters*2, kernel_size[0], kernel_size[1])) model.add(Activation('relu')) model.add(MaxPooling2D(pool_size=pool_size)) # (8, 8, 64) = (2048) model.add(Flatten()) model.add(Dense(1024)) model.add(Activation('relu')) model.add(Dropout(0.5)) …

154 python tensorflow deep-learning keras

12

Warum muss eine nichtlineare Aktivierungsfunktion in einem neuronalen Backpropagation-Netzwerk verwendet werden?

Ich habe einige Dinge über neuronale Netze gelesen und verstehe das allgemeine Prinzip eines einschichtigen neuronalen Netzes. Ich verstehe die Notwendigkeit zusätzlicher Schichten, aber warum werden nichtlineare Aktivierungsfunktionen verwendet? Dieser Frage folgt die folgende: Was ist eine Ableitung der Aktivierungsfunktion, die bei der Backpropagation verwendet wird?

139 math machine-learning neural-network deep-learning

4

Intuitives Verständnis von 1D-, 2D- und 3D-Faltungen in Faltungs-Neuronalen Netzen

Kann jemand bitte den Unterschied zwischen 1D-, 2D- und 3D-Faltungen in Faltungs-Neuronalen Netzen (beim tiefen Lernen) anhand von Beispielen klar erklären?

125 machine-learning deep-learning signal-processing conv-neural-network convolution

5

Welche Rolle spielt „Abflachen“ in Keras?

Ich versuche die Rolle der FlattenFunktion in Keras zu verstehen . Unten ist mein Code, der ein einfaches zweischichtiges Netzwerk ist. Es nimmt zweidimensionale Formdaten (3, 2) auf und gibt eindimensionale Formdaten (1, 4) aus: model = Sequential() model.add(Dense(16, input_shape=(3, 2))) model.add(Activation('relu')) model.add(Flatten()) model.add(Dense(4)) model.compile(loss='mean_squared_error', optimizer='SGD') x = np.array([[[1, 2], …

108 machine-learning tensorflow neural-network deep-learning keras

2

Viele zu einem und viele zu viele LSTM-Beispiele in Keras

Ich versuche LSTMs zu verstehen und wie man sie mit Keras erstellt. Ich fand heraus, dass es hauptsächlich die 4 Modi gibt, um eine RNN auszuführen (die 4 richtigen im Bild). Bildquelle: Andrej Karpathy Jetzt frage ich mich, wie ein minimalistischer Codefragment für jeden von ihnen in Keras aussehen würde. …

107 machine-learning neural-network deep-learning keras recurrent-neural-network

4

Multi-Layer-Perceptron (MLP) -Architektur: Kriterien für die Auswahl der Anzahl der verborgenen Schichten und der Größe der verborgenen Schicht?

Wenn wir 10 Eigenvektoren haben, können wir 10 neuronale Knoten in der Eingabeschicht haben. Wenn wir 5 Ausgabeklassen haben, können wir 5 Knoten in der Ausgabeschicht haben. Aber was sind die Kriterien für die Auswahl der Anzahl der verborgenen Schichten in einem MLP und wie viele neuronale Knoten in 1 …

104 machine-learning neural-network deep-learning perceptron

Als «deep-learning» getaggte Fragen