Ich möchte abschätzen können, ob ein vorgeschlagenes Modell klein genug ist, um auf einer GPU mit einer bestimmten Speichermenge trainiert zu werden Wenn ich eine einfache CNN-Architektur wie diese habe: Input: 50 x 50 x 3 C1: 32 3x3-Kernel mit Polsterung (ich denke in Wirklichkeit sind sie tatsächlich 3x3x3 angesichts …
Ich versuche, ein Modell in Keras zu trainieren, und verwende ModelCheckpoint , um das beste Modell gemäß einer überwachten Validierungsmetrik (in meinem Fall dem Jaccard-Index ) zu speichern . Während ich sehe, dass sich das Modell im Tensorboard verbessert, funktioniert es überhaupt nicht, wenn ich versuche, die Gewichte zu laden …
Angenommen, Sie haben eine Videodatei, deren Pixelreihenfolge einmal gemischt wurde. Das heißt, eine zufällige Reihenfolge wurde einmal definiert und auf alle Frames angewendet. Gibt es einen bekannten Ansatz zum Abrufen der anfänglichen Pixelreihenfolge? Ich habe einige Ideen zum Abrufen der anfänglichen Topologie, indem Pixel platziert werden, deren Werte räumlich und …
Ich suche nach einer guten Erklärung dafür, wie Windungen beim Deep Learning funktionieren, wenn sie auf Mehrkanalbilder angewendet werden. Nehmen wir zum Beispiel an, ich habe ein 100 x 100 Pixel großes Bild mit drei Kanälen, RGB. Der Eingangstensor hätte dann die Abmessungen 100 x 100 x 3. Wenn ich …
Ich habe mir online einige Videos über Faltungsnetzwerke angesehen, und der Redner diskutierte das Konzept, einen Filter über ein Bild zu führen. Er sagte, und es wird auch im Bild unten gezeigt, dass "Tiefe = semantische Darstellung". Das hört sich gut an, aber ich bin mir nicht sicher, was genau …
Ich möchte einen kleinen Datensatz verwenden, um ein CNN-Modell zu erstellen. Daher verwende ich die Datenerweiterung, um den Zugdatensatz zu vergrößern. Soll ich alle Augmentationstechniken (Argumente) verwenden , die aufgeführt hier ? Ich habe festgestellt, dass das Hinzufügen vieler Argumente die Genauigkeit des Modells verringert und das Trainingsset schwieriger macht …
Ich habe eine große Bildersammlung und möchte die Bilder in dieser Sammlung identifizieren, die andere Bilder aus der Sammlung zu kopieren scheinen. Um Ihnen einen Eindruck von den Arten von Bildpaaren zu geben, die ich als Übereinstimmungen klassifizieren möchte, betrachten Sie bitte diese Beispiele: Ich habe ungefähr 0,25 Millionen Paare …
Ich studiere derzeit dieses Papier , in dem CNN für die Phonemerkennung unter Verwendung der visuellen Darstellung von Log-Mel-Filterbänken und eines begrenzten Gewichtsverteilungsschemas angewendet wird. Die Visualisierung von Log-Mel-Filterbänken ist eine Möglichkeit, die Daten darzustellen und zu normalisieren. Sie schlagen vor, als Spektogramm mit RGB-Farben zu visualisieren. Das Beste, was …
Keras hat zwei border_mode für convolution2D, gleich und gültig. Könnte jemand erklären, was "dasselbe" tut, oder auf eine Dokumentation hinweisen? Ich konnte kein Dokument im Internet finden (außer Leute, die darum bitten, dass es auch in theano implementiert wird).
Ich habe mich gefragt, da CNNs jede bildbezogene Aufgabe dominiert haben. Wird der Viola-Jones-Gesichtsdetektor immer noch als Stand der Technik angesehen oder haben CNNs seine Leistung übertroffen?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.