Ein Bereich des maschinellen Lernens, der sich mit dem Lernen hierarchischer Darstellungen der Daten befasst, hauptsächlich mit tiefen neuronalen Netzen.
Ich habe ein paar Fragen, die mich bezüglich des CNN verwirren. 1) Die mit CNN extrahierten Merkmale sind skalierungs- und drehungsinvariant. 2) Die Kerne, die wir zur Faltung mit unseren Daten verwenden, sind bereits in der Literatur definiert? Was für ein Kernel sind das? ist es für jede Anwendung anders?
Können wir Bilder mit variabler Größe als Eingabe für die Objekterkennung in ein Faltungsnetzwerk geben? Wenn möglich, wie können wir das tun? Wenn wir jedoch versuchen, das Bild zuzuschneiden, verlieren wir einen Teil des Bildes, und wenn wir versuchen, die Größe zu ändern, geht die Klarheit des Bildes verloren. Bedeutet …
Hintergrund: Ein Großteil der modernen Forschung in den letzten ~ 4 Jahren (nach Alexander Net ) scheint von der Verwendung von generativem Pretraining für neuronale Netze abgewichen zu sein, um Klassifizierungsergebnisse auf dem neuesten Stand der Technik zu erzielen. Zum Beispiel beinhalten die Top-Ergebnisse für Mnist hier nur 2 Artikel …
Beim Erlernen des neuronalen Faltungsnetzwerks habe ich Fragen zu der folgenden Abbildung. 1) C1 in Layer 1 hat 6 Feature-Maps. Bedeutet das, dass es sechs Faltungskerne gibt? Jeder Faltungskernel wird verwendet, um eine Feature-Map auf der Grundlage von Eingaben zu generieren. 2) S1 in Schicht 2 hat 6 Merkmalskarten, C2 …
Ich beschäftige mich mit CNNs (Convolutional Neural Networks) aufgrund ihrer Anwendungen in der Bildverarbeitung. Ich bin bereits mit standardmäßigen neuronalen Feed-Forward-Netzen vertraut, daher hoffe ich, dass einige Leute hier mir helfen können, den zusätzlichen Schritt zum Verständnis von CNNs zu machen. Folgendes denke ich über CNNs: In herkömmlichen Feed-Forward-NNs haben …
Was bedeutet die Anzahl der Filter in einer Faltungsschicht? Wie wirkt sich diese Zahl auf die Leistung oder Qualität der Architektur aus? Ich meine, sollten wir uns immer für eine höhere Anzahl von Filtern entscheiden? was ist gut von ihnen? und Wie ordnet man unterschiedliche Anzahl von Filtern für verschiedene …
Ich möchte eine LSTM - Version ( Long Short Term Memory ) eines wiederkehrenden neuronalen Netzwerks (RNN) zur Modellierung von Zeitreihendaten verwenden. Mit zunehmender Sequenzlänge der Daten nimmt die Komplexität des Netzwerks zu. Ich bin deshalb neugierig, welche Länge von Sequenzen mit einer guten Genauigkeit modellierbar wäre. Ich möchte eine …
Während wir uns mit der Literatur über neuronale Netze befassen, können wir andere Methoden mit neuromorphen Topologien identifizieren ("Neural-Network" -ähnliche Architekturen). Und ich spreche nicht über den Satz der universellen Approximation . Beispiele sind unten angegeben. Dann frage ich mich: Was ist die Definition eines künstlichen neuronalen Netzwerks? Seine Topologie …
Ich habe keine zufriedenstellende Antwort von Google gefunden . Wenn die Daten, die ich habe, in der Größenordnung von Millionen liegen, ist Deep Learning natürlich der richtige Weg. Und ich habe gelesen, dass es vielleicht besser ist, beim maschinellen Lernen andere Methoden zu verwenden, wenn ich keine großen Datenmengen habe. …
Ich versuche zu lernen, wie man neuronale Netze benutzt. Ich habe dieses Tutorial gelesen . Nach dem Anpassen eines neuronalen Netzes an eine Zeitreihe unter Verwendung des Wertes bei zur Vorhersage des Wertes bei t + 1 erhält der Autor das folgende Diagramm, wobei die blaue Linie die Zeitreihe ist, …
Ab wann werden mehrschichtige neuronale Netze als tiefe neuronale Netze klassifiziert oder anders ausgedrückt: Wie viele Schichten müssen mindestens in einem tiefen neuronalen Netz vorhanden sein?
Ich habe viel über gewundene neuronale Netze gelesen und mich gefragt, wie sie das Problem des verschwindenden Gradienten vermeiden. Ich weiß, dass Deep-Believe-Netzwerke Single-Level-Auto-Encoder oder andere vorgefertigte flache Netzwerke stapeln und so dieses Problem vermeiden können, aber ich weiß nicht, wie es in CNNs vermieden wird. Laut Wikipedia : "Trotz …
http://www.deeplearningbook.org/contents/ml.html In diesem Abschnitt wird der Bayes-Fehler wie folgt erläutert Das ideale Modell ist ein Orakel, das einfach die wahre Wahrscheinlichkeitsverteilung kennt, die die Daten erzeugt. Sogar ein solches Modell wird bei vielen Problemen immer noch Fehler verursachen, da möglicherweise immer noch Rauschen in der Verteilung vorhanden ist. Im Fall …
Ich möchte ein Projekt zur optischen Zeichenerkennung (OCR) durchführen. Nach einigen Recherchen bin ich auf eine Architektur gestoßen, die interessant erscheint: CNN + RNN + CTC. Ich bin mit verschachtelten neuronalen Netzen (CNN) und wiederkehrenden neuronalen Netzen (RNN) vertraut, aber was ist Connectionist Temporal Classification (CTC)? Ich hätte gerne eine …
Im grundlegenden maschinellen Lernen lernen wir die folgenden "Faustregeln": a) Die Größe Ihrer Daten sollte mindestens das 10-fache der Größe der VC-Dimension Ihres Hypothesensatzes betragen. b) Ein neuronales Netz mit N Anschlüssen hat eine VC-Dimension von ungefähr N. Wenn also ein Deep Learning-neuronales Netzwerk Millionen von Einheiten umfasst, sollten wir …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.