Als «neural-networks» getaggte Fragen

Bei Fragen zu künstlichen Netzwerken wie MLPs, CNNs, RNNs, LSTM- und GRU-Netzwerken, deren Varianten oder anderen AI-Systemkomponenten, die sich als neuronale Netzwerke qualifizieren, sind sie teilweise von biologischen neuronalen Netzwerken inspiriert.

2
Verringern sich die Mängel neuronaler Netze?
Nachdem ich ungefähr ein halbes Jahr lang mit neuronalen Netzen gearbeitet habe, habe ich aus erster Hand erfahren, was oft als ihre Hauptnachteile bezeichnet wird, dh Überanpassung und Festhalten an lokalen Minima. Durch Hyperparameteroptimierung und einige neu erfundene Ansätze wurden diese jedoch für meine Szenarien überwunden. Aus meinen eigenen Experimenten: …

2
Was ist der Unterschied zwischen hyperbolischen Tangenten- und Sigmoidneuronen?
Zwei übliche Aktivierungsfunktionen, die beim tiefen Lernen verwendet werden, sind die hyperbolische Tangentenfunktion und die Sigmoidaktivierungsfunktion. Ich verstehe, dass die hyperbolische Tangente nur eine Neuskalierung und Übersetzung der Sigmoidfunktion ist: tanh( z) = 2 σ( z) - 1tanh⁡(z)=2σ(z)- -1\tanh(z) = 2\sigma(z) - 1 . Gibt es einen signifikanten Unterschied zwischen …


2
Gibt es dynamische neuronale Netze?
Gibt es neuronale Netze, die entscheiden können, Neuronen hinzuzufügen / zu löschen (oder die Neuronenmodelle / Aktivierungsfunktionen zu ändern oder die zugewiesene Bedeutung für Neuronen zu ändern), Verknüpfungen oder sogar vollständige Schichten während der Ausführungszeit? Ich vermute, dass solche neuronalen Netze die übliche Trennung von Lern- / Inferenzphasen überwinden und …


2
Warum wird ein einschichtiges verstecktes Netzwerk gegenüber einer schlechten Initialisierung mit einer wachsenden Anzahl versteckter Neuronen robuster?
Kurz gesagt: Ich möchte verstehen, warum ein neuronales Netzwerk mit einer verborgenen Schicht zuverlässiger auf ein gutes Minimum konvergiert, wenn eine größere Anzahl versteckter Neuronen verwendet wird. Nachfolgend eine detailliertere Erklärung meines Experiments: Ich arbeite an einem einfachen 2D-XOR-ähnlichen Klassifizierungsbeispiel, um die Auswirkungen der Initialisierung neuronaler Netze besser zu verstehen. …




2
Wie wählen wir die Kernelgröße je nach Problem?
Das Finden geeigneter Hyperparameter für ein neuronales Netzwerk ist offensichtlich eine komplexe Aufgabe und ein Problem oder domänenspezifisch. Es sollte jedoch mindestens einige "Regeln" geben, die für die Größe des Filters (oder Kernels) meistens gelten! In den meisten Fällen sollte die Intuition darin bestehen, kleine Filter zur Erkennung von Hochfrequenzmerkmalen …

1
Verlustfunktionen für die hierarchische Multi-Label-Klassifizierung?
Ich möchte verschiedene Verlustfunktionen für ein hierarchisches Klassifizierungsproblem mit mehreren Etiketten ausprobieren. Bisher habe ich verschiedene Modelle oder Submodelle wie den Multilayer Perceptron (MLP) -Zweig in einem größeren Modell trainiert, das sich mit verschiedenen Klassifizierungsebenen befasst und einen binären Vektor ergibt. Ich habe auch Binary Cross Entopy (BCE) verwendet und …


3
Was macht das tierische Gehirn so besonders?
Das ist also eine einleitende Frage. Wann immer ich ein Buch über neuronale Netze oder maschinelles Lernen lese, heißt es in ihrem Einführungskapitel, dass wir die Kraft des Gehirns aufgrund seiner massiven Parallelität nicht reproduzieren konnten. In der heutigen Zeit wurden Transistoren auf die Größe von Nanometern reduziert, viel kleiner …


1
Welche Herausforderungen in der Informationssicherheit können mit neuronalen Netzen besser gelöst werden?
Informationssicherheit hat sich in den letzten Jahren zu einem florierenden Feld entwickelt. Es ist ein breiter Bereich, der von der Planung und dem Aufbau über das Testen bis zum sicheren Betrieb verschiedener Anwendungen , Systeme und Netzwerke reicht . Von kleinen eingebetteten Systemen bis hin zu großen Unternehmensanwendungen ist Sicherheit …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.