In dem Artikel Batch-Normalisierung: Beschleunigen des tiefen Netzwerktrainings durch Reduzieren der internen Kovariatenverschiebung ( hier ) Bevor der Prozess der Batch-Normalisierung erläutert wird, wird versucht, die damit verbundenen Probleme zu erklären (ich verstehe nicht, was genau hier angesprochen wird) . Auszug aus Abschnitt 2, Abs. 2: Wir könnten in Betracht …
Was ist die beste Kostenfunktion, um ein neuronales Netzwerk für die Durchführung einer ordinalen Regression zu trainieren , dh um ein Ergebnis vorherzusagen, dessen Wert auf einer beliebigen Skala existiert, bei der nur die relative Reihenfolge zwischen verschiedenen Werten von Bedeutung ist (z. B. um vorherzusagen, welche Produktgröße ein Kunde …
Ich habe einige Modelle für ein Projekt erstellt, aber ich kann mich nicht mit der Mathematik der Adagrad- und Adadelta-Algorithmen befassen. Ich verstehe, wie Vanille-Gradienten-Abstieg funktioniert, und ich habe Code geschrieben, damit er erfolgreich funktioniert. Ich wäre dankbar, wenn mir jemand diese beiden Dinge erklären oder eine Ressource bereitstellen würde, …
Angenommen, Sie haben eine Videodatei, deren Pixelreihenfolge einmal gemischt wurde. Das heißt, eine zufällige Reihenfolge wurde einmal definiert und auf alle Frames angewendet. Gibt es einen bekannten Ansatz zum Abrufen der anfänglichen Pixelreihenfolge? Ich habe einige Ideen zum Abrufen der anfänglichen Topologie, indem Pixel platziert werden, deren Werte räumlich und …
Ich möchte den Unterschied in Bezug auf Anwendungen (z. B. welche ist die Erkennung von Kreditkartenbetrug?) Und in Bezug auf verwendete Techniken kennen. Beispielpapiere, die die Aufgabe definieren, wären willkommen.
Ich habe ein Faltungsnetzwerk trainiert, um Bilder einer mechanischen Komponente als gut oder fehlerhaft zu klassifizieren. Obwohl die Testgenauigkeit hoch war, stellte ich fest, dass das Modell bei Bildern mit leicht unterschiedlicher Beleuchtung eine schlechte Leistung zeigte. Die Funktionen, die ich zu erkennen versuche, sind subtil, und die Beleuchtung scheint …
Ich habe einen großen Datensatz und eine Kosinusähnlichkeit zwischen ihnen. Ich möchte sie mit Cosinus-Ähnlichkeit gruppieren, die ähnliche Objekte zusammenfügt, ohne vorher die Anzahl der erwarteten Cluster angeben zu müssen. Ich habe die sklearn-Dokumentation von DBSCAN und Affinity Propagation gelesen, in der beide eine Distanzmatrix (keine Kosinus-Ähnlichkeitsmatrix) benötigen. Wirklich, ich …
Ich weiß, dass Polynomial Logistic Regressionman damit leicht typische Daten wie das folgende Bild lernen kann: Ich habe mich gefragt, ob die folgenden beiden Daten auch mit gelernt werden können oder nicht. Polynomial Logistic Regression Ich muss wohl noch mehr Erklärungen hinzufügen. Nehmen Sie die erste Form an. Wenn wir …
Ich verwende ein Paket Kerasin R, um ein neuronales Netzwerk zu erstellen . Wie kann ich die Ausgabe aus einer verborgenen Ebene extrahieren? Ich habe ein Beispiel in Python gefunden, aber ich habe nur keine Ahnung, wie ich das in R machen soll.
Ich habe die folgenden Daten für ein kleines Nebenprojekt. Es ist von einem Beschleunigungsmesser, der auf einer Waschmaschine / einem Trockner sitzt, und ich möchte, dass er mir sagt, wann die Maschine fertig ist. x sind die Eingabedaten (x / y / z-Bewegung als ein Wert), y ist die Beschriftung …
Ich habe ein einfaches neuronales Netzwerk (NN) für die MNIST-Klassifizierung. Es enthält 2 versteckte Schichten mit jeweils 500 Neuronen. Daher sind die Abmessungen des NN: 784-500-500-10. ReLU wird in allen Neuronen verwendet, Softmax wird am Ausgang verwendet und Kreuzentropie ist die Verlustfunktion. Was mich verwundert ist, warum Überanpassung den NN …
Verwendung von Naive Bayes für die Klassifizierung von Text mit mehreren Etiketten in R. Ich habe versucht, naiveBayes () aus der e1071-Bibliothek zu verwenden, aber es scheint, dass während des Trainings keine Klassenvariablen mit mehreren Labels akzeptiert werden. Ich habe TermDocumentMatrix mithilfe des Textdokumentkorpus erstellt und versucht, das Modell mithilfe …
Ich arbeite an einem stark unausgeglichenen Datensatz mit binären Bezeichnungen, bei dem die Anzahl der echten Bezeichnungen nur 7% des gesamten Datensatzes beträgt. Eine Kombination von Merkmalen kann jedoch zu einer überdurchschnittlichen Anzahl von Merkmalen in einer Teilmenge führen. ZB haben wir folgenden Datensatz mit einem einzigen Merkmal (Farbe): 180 …
Ich suche nach einer guten Erklärung dafür, wie Windungen beim Deep Learning funktionieren, wenn sie auf Mehrkanalbilder angewendet werden. Nehmen wir zum Beispiel an, ich habe ein 100 x 100 Pixel großes Bild mit drei Kanälen, RGB. Der Eingangstensor hätte dann die Abmessungen 100 x 100 x 3. Wenn ich …
Ich habe Pakete gefunden, die zur Berechnung des "Informationsgewinns" zur Auswahl der Hauptattribute in C4.5 Decision Tree verwendet werden, und ich habe versucht, sie zur Berechnung des "Informationsgewinns" zu verwenden. Die Ergebnisse der Berechnung der einzelnen Pakete unterscheiden sich jedoch wie im folgenden Code. > IG.CORElearn <- attrEval(In_Occu ~ In_Temp+In_Humi+In_CO2+In_Illu+In_LP+Out_Temp+Out_Humi, …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.