Es sieht für mich so aus, als ob die undichte ReLU eine viel bessere Leistung haben sollte, da die Standard-ReLU nicht die Hälfte ihres Speicherplatzes nutzen kann (x <0, wenn der Gradient Null ist). Dies ist jedoch nicht der Fall und in der Praxis verwenden die meisten Benutzer Standard-ReLU.
Keras bietet eine Möglichkeit, die Funktionen eines vorab trainierten Modells zu extrahieren, die hier beschrieben werden. Https://keras.io/applications/ from keras.applications.vgg16 import VGG16 from keras.preprocessing import image from keras.applications.vgg16 import preprocess_input import numpy as np model = VGG16(weights='imagenet', include_top=False) img_path = 'elephant.jpg' img = image.load_img(img_path, target_size=(224, 224)) x = image.img_to_array(img) x = …
Ich versuche, ein optisches Zeichenerkennungssystem zum Erkennen des Kennzeichens (indonesisches Kennzeichen) aufzubauen. Leider ist kein Trainingssatz verfügbar, aber ich habe die Schriftart gefunden. Ich versuche, die Trainingsdaten zu generieren, indem ich das Bild des Kennzeichens mit Kerneln zusammenfalte (etwas wie Gaußsche Unschärfe, Box-Unschärfe) mit Python, aber es ähnelt nicht echten …
Mein Verständnis ist, dass GPUs effizienter für den Betrieb neuronaler Netze sind, aber kürzlich hat mir jemand vorgeschlagen, dass GPUs nur für die Trainingsphase benötigt werden. Einmal trainiert, ist es tatsächlich effizienter, sie auf CPUs auszuführen. Ist das wahr?
Ist es möglich, ein neuronales Netzwerk zu erstellen, das eine konsistente Ausgabe liefert, da die Eingabe in Vektoren unterschiedlicher Länge vorliegen kann? Ich bin derzeit in einer Situation, in der ich viele Audiodateien mit unterschiedlicher Länge abgetastet habe und ein neuronales Netzwerk trainieren muss, um bei einer bestimmten Eingabe die …
Ich würde gerne sehen, ob ich einige der Bildnetzergebnisse reproduzieren kann. Ich konnte jedoch die Daten (die Liste der URLs), die für das Training / Testen in den ILSVRC 2012 (oder höher) Klassifizierungsherausforderungen verwendet wurden, nicht finden. Ich habe nur http://www.image-net.org/download-imageurls gefunden . Wo werden die Daten für die Klassifizierungsherausforderung …
Angesichts der Tatsache, dass Naive Bayes die Wahrscheinlichkeit verwendet, um eine Vorhersage zu treffen, und Merkmale als bedingt unabhängig voneinander behandelt, ist es sinnvoll, dass das Modell dennoch eine Vorhersage treffen kann, da einige Merkmale in den Testdaten fehlen. Ich weiß, dass es üblich ist, fehlende Daten zu unterstellen, aber …
ReLU ist eine Aktivierungsfunktion, definiert als wobei a = Wx + b .h=max(0,a)h=max(0,a)h = \max(0, a)a=Wx+ba=Wx+ba = Wx + b Normalerweise trainieren wir neuronale Netze mit Methoden erster Ordnung wie SGD, Adam, RMSprop, Adadelta oder Adagrad. Die Rückausbreitung in Verfahren erster Ordnung erfordert eine Ableitung erster Ordnung. Daher wird xxx …
Ich habe eine große Anzahl von Bildern, die ich zum Trainieren eines Clustering-Algorithmus klassifizieren muss, und ich möchte dies offline tun (die Daten sind proprietär). Grundsätzlich möchte ich ein Desktop-Umfragetool erstellen, mit dem ich jedes Bild schnell in eine oder zwei Kategorien einteilen kann. Im Idealfall würde das Tool: Suchen …
Ich bin neu hier. Ich stehe kurz vor einem Abschlussinterview für eine Stelle als Datenwissenschaftler für ein Unternehmen (im Bereich E-Commerce), das für die Datenwissenschaft neu ist. Es ist eine ziemlich neue Position für das Unternehmen, und aus den Interviews, die ich bisher geführt habe, habe ich festgestellt, dass sie …
Ich arbeite an einer gemeinnützigen Organisation, bei der wir versuchen, potenziellen Universitätsbewerbern zu helfen, indem wir sie mit Alumni zusammenbringen, die ihre Erfahrungen / Weisheiten teilen möchten. Im Moment geschieht dies manuell. Ich werde also zwei Tische haben, einen mit Studenten und einen mit Alumni (sie haben möglicherweise einige Gemeinsamkeiten, …
Ich schreibe meinen eigenen Trainingsalgorithmus, weiß aber nicht, wie ich das Bias-Gewicht einstellen soll. Muss ich in einer Ebene eine Vorspannung einstellen? Muss das Bias-Gewicht in jeder Schicht aktualisiert werden?
Keras hat zwei border_mode für convolution2D, gleich und gültig. Könnte jemand erklären, was "dasselbe" tut, oder auf eine Dokumentation hinweisen? Ich konnte kein Dokument im Internet finden (außer Leute, die darum bitten, dass es auch in theano implementiert wird).
Wenn ich in der Vergangenheit verschiedene Algorithmen für maschinelles Lernen ausprobiert habe, um ein Problem zu lösen, habe ich die Ansätze auf ein Notizbuch geschrieben und dabei Details wie Funktionen, Vorverarbeitung von Funktionen, Normalisierung, Algorithmen, Algorithmusparameter usw. beibehalten. ein handgeschriebenes Logbuch erstellen. Derzeit bin ich jedoch besorgt darüber, ein "professionelleres" …
Bei binären Klassifizierungsproblemen scheint der F1-Score häufig als Leistungsmaß verwendet zu werden. Soweit ich verstanden habe, besteht die Idee darin, den besten Kompromiss zwischen Präzision und Rückruf zu finden. Die Formel für die F1-Punktzahl ist in Präzision und Rückruf symmetrisch. Es gibt jedoch (und das stört mich) eine Asymmetrie zwischen …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.