Ich habe zwei Tensoren a:[batch_size, dim] b:[batch_size, dim]. Ich möchte inneres Produkt für jedes Paar in der Charge machen c:[batch_size, 1], wo erzeugen c[i,0]=a[i,:].T*b[i,:]. Wie?
Geschlossen . Diese Frage muss fokussierter sein . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so, dass sie sich nur auf ein Problem konzentriert, indem Sie diesen Beitrag bearbeiten . Geschlossen vor 4 Jahren . Ich arbeite an einem Projekt und habe Schwierigkeiten …
Angenommen, Sie haben ein Dataset mit Millionen von Zeilen und den Attributen Nur-Text, Schlüssel und Ausgabe-Chiffretext. Könnte Deep Learning theoretisch verwendet werden, um Muster in den Ausgaben zu finden, die helfen, den Chiffretext zu entschlüsseln? Gibt es andere mögliche Ansätze?
Das Caret-Paket von R funktioniert mit 180 Modellen. Der Autor warnt davor, dass ein Teil des Pakets unlösbar langsam oder weniger genau sein kann als Modelle der ersten Wahl. Der Autor ist nicht falsch. Ich habe versucht, Boruta- und evtree-Modelle zu trainieren und musste aufgeben, nachdem sie> 5 Stunden in …
Was bewirkt es, die Filtergewichte eines CNN während der Backpropagation NICHT zu ändern? Ich habe beim Training des MNIST-Datensatzes nur die vollständig verbundenen Schichtgewichte geändert und trotzdem eine Genauigkeit von fast 99 Prozent erreicht.
Ich trainiere derzeit ein neuronales Netzwerk und kann mich nicht entscheiden, welches zur Implementierung meiner Early-Stop-Kriterien verwendet werden soll: Validierungsverlust oder Metriken wie Genauigkeit / f1score / auc / was auch immer auf dem Validierungssatz berechnet. Bei meinen Recherchen stieß ich auf Artikel, die beide Standpunkte verteidigten. Keras scheint standardmäßig …
Ich habe etwas über Faltungs-Neuronale Netze gelernt. Bei der Betrachtung von KerasBeispielen bin ich auf drei verschiedene Faltungsmethoden gestoßen. Nämlich 1D, 2D & 3D. Was sind die Unterschiede zwischen diesen drei Schichten? Was sind ihre Anwendungsfälle? Gibt es einige Links oder Verweise, um ihre Anwendungsfälle zu zeigen?
Ich versuche, ein intelligentes Modell zu generieren, das eine Reihe von Wörtern oder Zeichenfolgen scannen und mithilfe von maschinellem Lernen oder Deep Learning als Namen, Handynummern, Adressen, Städte, Bundesstaaten, Länder und andere Einheiten klassifizieren kann. Ich hatte nach Ansätzen gesucht, aber leider keinen Ansatz gefunden. Ich hatte versucht, mit einer …
Ich arbeite an einer Textklassifizierung mit 39 Kategorien / Klassen und 8,5 Millionen Datensätzen. (In Zukunft werden Daten und Kategorien zunehmen). Struktur oder Format meiner Daten ist wie folgt. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | 211 Storage:128 GB, RAM:4 …
Das Bild unten zeigt 7 Punkte um den Ursprung. Einer von ihnen wurde von einem Menschen aufgrund von Regeln und Erfahrungen ausgewählt und ist rot gefärbt (der im unteren linken Quadranten). Jetzt haben wir über 1000 dieser Punktmengen und für jede Menge hat ein Mensch einen einzelnen Punkt ausgewählt. Diese …
Angenommen, ich interessiere mich für drei Klassen , , . Mein Datensatz enthält jedoch tatsächlich mehrere weitere reale Klassen .c 2 c 3 ( c j ) n j = 4c1c1c_1c2c2c_2c3c3c_3( cj)nj = 4(cj)j=4n(c_j)_{j=4}^n Die offensichtliche Antwort besteht darin, eine neue Klasse zu definieren , die sich auf alle Klassen …
Wenn ich ein Lernproblem habe, das eine inhärente Symmetrie haben sollte, gibt es eine Möglichkeit, mein Lernproblem einer Symmetrieeinschränkung zu unterwerfen, um das Lernen zu verbessern? Wenn ich beispielsweise eine Bilderkennung durchführe, möchte ich möglicherweise eine 2D-Rotationssymmetrie. Dies bedeutet, dass die gedrehte Version eines Bildes das gleiche Ergebnis wie das …
Mit ganzen Daten meine ich Zug + Test + Validierung Wenn ich meinen Hyperparameter anhand der Validierungsdaten festgelegt und das Modell anhand der Testdaten ausgewählt habe, ist es nicht besser, ein Modell für die gesamten Daten zu trainieren, damit die Parameter besser trainiert werden, als das Modell nur für die …
Ich hatte eine interessante Diskussion über ein Projekt, an dem wir arbeiteten: Warum ein visuelles CNN-Inspektionssystem über einem Template-Matching-Algorithmus verwenden? Hintergrund: Ich hatte eine Demo eines einfachen CNN-Bildverarbeitungssystems (Webcam + Laptop) gezeigt, das feststellte, ob ein bestimmter Objekttyp "defekt" / defekt war oder nicht - in diesem Fall eine Leiterplatte. …
In diesem häufig zitierten Artikel diskutieren die Autoren die Anzahl der Gewichtsparameter wie folgt. Ich bin mir nicht ganz sicher, warum es Parameter hat. Ich denke, es sollte da jeder der Eingangskanäle den gleichen Filter hat, der Parameter hat. 49 C C 4949 C.249C249C^249 C.49C49CC.CC494949
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.