Als «neural-network» getaggte Fragen

Künstliche neuronale Netze (ANN) bestehen aus "Neuronen" - Programmierkonstrukten, die die Eigenschaften biologischer Neuronen nachahmen. Eine Reihe gewichteter Verbindungen zwischen den Neuronen ermöglicht die Verbreitung von Informationen durch das Netzwerk, um Probleme mit künstlicher Intelligenz zu lösen, ohne dass der Netzwerkdesigner ein Modell eines realen Systems hatte.

3
CNN-Speicherverbrauch
Ich möchte abschätzen können, ob ein vorgeschlagenes Modell klein genug ist, um auf einer GPU mit einer bestimmten Speichermenge trainiert zu werden Wenn ich eine einfache CNN-Architektur wie diese habe: Input: 50 x 50 x 3 C1: 32 3x3-Kernel mit Polsterung (ich denke in Wirklichkeit sind sie tatsächlich 3x3x3 angesichts …

1
Verstärkungslernen mit neuronalen Netzen verstehen (Q-Learning)
Ich versuche, Verstärkungslernen und Markov-Entscheidungsprozesse (MDP) zu verstehen, wenn ein neuronales Netz als Funktionsnäherungswert verwendet wird. Ich habe Schwierigkeiten mit der Beziehung zwischen dem MDP, in dem die Umgebung auf probabilistische Weise untersucht wird, wie dies auf Lernparameter zurückgeführt wird und wie die endgültige Lösung / Richtlinien gefunden werden. Kann …

1
Grundlegendes zu Ausfall und Gefälle
Ich schaue mir an, wie man Dropout in einem tiefen neuronalen Netzwerk implementiert, und fand etwas, das nicht intuitiv ist. In der Vorwärtsphase fallen Dropout-Maskenaktivierungen mit einem zufälligen Tensor von 1s und 0s an, um das Netz zu zwingen, den Durchschnitt der Gewichte zu lernen. Dies hilft dem Netz, besser …


1
Batch-Normalisierung verstehen
In dem Artikel Batch-Normalisierung: Beschleunigen des tiefen Netzwerktrainings durch Reduzieren der internen Kovariatenverschiebung ( hier ) Bevor der Prozess der Batch-Normalisierung erläutert wird, wird versucht, die damit verbundenen Probleme zu erklären (ich verstehe nicht, was genau hier angesprochen wird) . Auszug aus Abschnitt 2, Abs. 2: Wir könnten in Betracht …



2
Warum zerstört eine Überanpassung nicht die neuronalen Netze für die MNIST-Klassifizierung?
Ich habe ein einfaches neuronales Netzwerk (NN) für die MNIST-Klassifizierung. Es enthält 2 versteckte Schichten mit jeweils 500 Neuronen. Daher sind die Abmessungen des NN: 784-500-500-10. ReLU wird in allen Neuronen verwendet, Softmax wird am Ausgang verwendet und Kreuzentropie ist die Verlustfunktion. Was mich verwundert ist, warum Überanpassung den NN …

1
Maschinelles Lernen: Gedichte schreiben
Ich bin ein Student des maschinellen Lernens und in diesen Tagen habe ich versucht zu lernen, wie man die TensorFlow-Bibliothek benutzt. Ich habe verschiedene Tutorials und Versuche mit Tensorflow durchlaufen und dachte, der beste Weg, dies wirklich zu lernen, wäre, es in einem kleinen eigenen Projekt zu verwenden. Ich habe …

1
Fragen beim Übergang vom Vanilla Neural Network zum Recurrent Neural Network
Ich habe kürzlich erfahren, wie ein neuronales Vanille-Netzwerk mit einer bestimmten Anzahl von Eingaben, versteckten Knoten und der gleichen Anzahl von Ausgaben wie Eingaben funktionieren würde. Ich habe mir verschiedene Beiträge angesehen, die sich jetzt auf wiederkehrende neuronale Netze beziehen, und ich verstehe das Konzept dahinter, aber ich verstehe bestimmte …


2
Was ist eine LSTM-LM-Formulierung?
Ich lese diesen Artikel "Sequence to Sequence Learning mit neuronalen Netzen" http://papers.nips.cc/paper/5346-sequence-to-sequence-learning-with-neural-networks.pdf Unter "2. Das Modell" steht: Das LSTM berechnet diese bedingte Wahrscheinlichkeit, indem es zuerst die feste dimensionale Darstellung v der Eingabesequenz (x1, ..., xT) erhält, die durch den letzten verborgenen Zustand des LSTM gegeben ist, und dann die …



1
Gibt es eine Domäne, in der Spiking Neural Networks andere Algorithmen übertreffen (Non-Spiking)?
Ich lese über Reservoir-Computing- Techniken wie Echo State Networks und Liquid State Machines . Beide Verfahren umfassen das Zuführen von Eingaben zu einer Population zufällig (oder nicht) verbundener Spike-Neuronen und einen relativ einfachen Auslesealgorithmus, der die Ausgabe erzeugt (z. B. lineare Regression). Die Neuronenpopulationsgewichte werden entweder festgelegt oder über eine …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.