Als «deep-learning» getaggte Fragen

Ein neues Gebiet der maschinellen Lernforschung, das sich mit den Technologien befasst, die zum Lernen hierarchischer Darstellungen von Daten verwendet werden, hauptsächlich mit tiefen neuronalen Netzen (dh Netzen mit zwei oder mehr verborgenen Schichten), aber auch mit einer Art probabilistischer grafischer Modelle.

3
Fuzzy-Name und Spitzname stimmen überein
Ich habe einen Datensatz mit folgender Struktur: full_name,nickname,match Christian Douglas,Chris,1, Jhon Stevens,Charlie,0, David Jr Simpson,Junior,1 Anastasia Williams,Stacie,1 Lara Williams,Ana,0 John Williams,Willy,1 Dabei ist jede Prädiktorzeile ein Paar, vollständiger Name, Spitzname und Zielvariable, Übereinstimmung. Dies ist 1, wenn der Spitzname der Person mit diesem Namen entspricht, andernfalls 0. Wie Sie sehen …

2
Gibt es einen Konsens über die Wahl eines geeigneten ML-Ansatzes?
Ich studiere zurzeit Datenwissenschaft und wir lernen eine schwindelerregende Vielfalt grundlegender Regressions- / Klassifizierungstechniken (linear, logistisch, Bäume, Splines, ANN, SVM, MARS usw.) sowie eine Vielzahl von zusätzliche Werkzeuge (Bootstrapping, Boosten, Absacken, Ensemble, Ridge / Lasso, CV usw. usw.). Manchmal erhalten die Techniken einen Kontext (z. B. geeignet für kleine / …


4
Mustererkennung am Finanzmarkt
Welches Modell für maschinelles Lernen oder tiefes Lernen ( muss überwachtes Lernen sein ) eignet sich am besten zum Erkennen von Mustern auf den Finanzmärkten? Was ich unter Mustererkennung auf dem Finanzmarkt verstehe: Das folgende Bild zeigt, wie ein Beispielmuster (dh Kopf und Schulter) aussieht: Bild 1: Das folgende Bild …


1
Wie funktioniert ein Encoder-Decoder-Netzwerk?
Angenommen, ich habe ein Encoder-Decoder-Netzwerk auf einem Cat- Datensatz trainiert, wobei der Rekonstruktionsfehler als Verlustfunktion verwendet wurde. Das Netzwerk ist vollständig trainiert und der Decoder kann gute Katzenbilder rekonstruieren . Was ist nun, wenn ich dasselbe Netzwerk verwende und ein Hundebild eingebe ? Wird das Netzwerk in der Lage sein …

1
Datenerweiterung bei Verwendung von flow_from_directory in CNN
Ich möchte einen kleinen Datensatz verwenden, um ein CNN-Modell zu erstellen. Daher verwende ich die Datenerweiterung, um den Zugdatensatz zu vergrößern. Soll ich alle Augmentationstechniken (Argumente) verwenden , die aufgeführt hier ? Ich habe festgestellt, dass das Hinzufügen vieler Argumente die Genauigkeit des Modells verringert und das Trainingsset schwieriger macht …

3
Warum verwendet die Logistikfunktion e anstelle von 2?
Die Sigmoidfunktion könnte als Aktivierungsfunktion beim maschinellen Lernen verwendet werden. S(x)=11+e−x=exex+1.S(x)=11+e−x=exex+1.{\displaystyle S(x)={\frac {1}{1+e^{-x}}}={\frac {e^{x}}{e^{x}+1}}.} Wenn e durch 2 ersetzt wird, def sigmoid2(z): return 1/(1+2**(-z)) x = np.arange(-9,9,dtype=float) y = sigmoid2(x) plt.scatter(x,y) Die Handlung sieht ähnlich aus. Warum wird die Logistikfunktion verwendet? eee eher als 2?


4
Kann das Problem des verschwindenden Gradienten gelöst werden, indem die Eingabe von tanh mit einem Koeffizienten multipliziert wird?
Nach meinem Verständnis tritt das Problem des verschwindenden Gradienten beim Training neuronaler Netze auf, wenn der Gradient jeder Aktivierungsfunktion kleiner als 1 ist, so dass das Produkt dieser Gradienten sehr klein wird, wenn Korrekturen durch viele Schichten zurückpropagiert werden. Ich weiß, dass es andere Lösungen wie eine Gleichrichteraktivierungsfunktion gibt , …

1
Wie kann ich nachweisen, dass die Engpassschicht meines CNN-Auto-Encoders nützliche Informationen enthält?
Ich verwende den CNN-Autoencoder, um eine Zustandsrepräsentationsschicht zu erstellen, die ich später in meinen Verstärkungsagenten einspeisen werde. Also habe ich meinen CNN-Autoencoder trainiert und er gibt nette Zustandsdarstellungen. Aber ich habe folgende Fragen: Kann meine Autoencoder-Schicht überpasst werden? Wenn es eine Überanpassung gibt, führt dies zu Abfallinformationen in meiner Engpassschicht?



1
Wie zeichnet man Faltungsdiagramme für neuronale Netze?
Ich muss ein ähnliches CNN-Diagramm zeichnen: Ich habe alle unter https://datascience.stackexchange.com/a/14900 genannten Tools ausprobiert , aber es gibt keine einfache Möglichkeit, dies zu tun. Gibt es eine automatisierte Möglichkeit, dies zu tun? Oder muss ich es manuell machen. Ist es außerdem möglich, dies zu zeichnen?: Ich fand http://alexlenail.me/NN-SVG/LeNet.html , in …

1
Überschreiten Deep-Learning-Modelle die erforderliche Kapazität für die geschätzten Entropien ihrer Datensätze?
Diese Frage mag etwas seltsam erscheinen. Ich machte einige Selbststudien zur Informationstheorie und beschloss, weitere formale Untersuchungen zum Deep Learning durchzuführen. Bitte nehmen Sie mit, wenn ich versuche zu erklären. Ich nahm eine große "Trainings" -Untergruppe von MNIST als mein Meerschweinchen. 1) Konvertierte jedes Bild in MNIST in "Schwarzweiß" (Pixelwerte …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.