Betrachten Sie ein neuronales Netzwerk: Für einen bestimmten Datensatz teilen wir ihn in Schulungs-, Validierungs- und Testsätze ein. Angenommen, wir tun dies im klassischen Verhältnis 60:20:20. Dann verhindern wir eine Überanpassung, indem wir das Netzwerk validieren, indem wir es auf dem Validierungssatz überprüfen. Was ist dann die Notwendigkeit, es auf …
Ich versuche anhand dieser Notizen von Andrej Karphaty zu berechnen, wie viel Speicher eine GPU zum Trainieren meines Modells benötigt: http://cs231n.github.io/convolutional-networks/#computational-considerations Mein Netzwerk hat 532.752 Aktivierungen und 19.072.984 Parameter (Gewichte und Vorspannungen). Dies sind alles 32-Bit-Float-Werte, sodass jeder 4 Bytes im Speicher benötigt. Mein Eingabebild ist 180x50x1 (Breite x Höhe …
Ich arbeite an der Spracherkennung mit Tensorflow und plane, LSTM NN mit einem Datensatz für massive Wellen zu trainieren. Aufgrund der Leistungssteigerungen plane ich, tfrecords zu verwenden. Im Internet gibt es mehrere Beispiele (z. B. Inception), in denen tfrecords-Dateien in Shards aufgeteilt sind. Meine Frage ist: Was ist der Vorteil …
Ich habe spärliche Merkmale, die prädiktiv sind, und ich habe einige dichte Merkmale, die auch prädiktiv sind. Ich muss diese Funktionen kombinieren, um die Gesamtleistung des Klassifikators zu verbessern. Wenn ich nun versuche, diese Merkmale zu kombinieren, dominieren die dichten Merkmale tendenziell stärker als die spärlichen Merkmale, wodurch sich die …
Ich habe einige Schwierigkeiten, mit ReLU die Rückübertragung abzuleiten, und ich habe einige Arbeit geleistet, bin mir aber nicht sicher, ob ich auf dem richtigen Weg bin. Kostenfunktion: wobei der reale Wert und ein vorhergesagter Wert ist. Nehmen Sie auch an, dass > 0 immer ist.y y x12(y−y^)212(y−y^)2\frac{1}{2}(y-\hat y)^2yyyy^y^\hat yxxx …
Ich habe 3 Klassen mit dieser Verteilung: Class 0: 0.1169 Class 1: 0.7668 Class 2: 0.1163 Und ich benutze xgboostfür die Klassifizierung. Ich weiß, dass es einen Parameter namens gibt scale_pos_weight. Aber wie wird es bei "Multiclass" -Fällen gehandhabt und wie kann ich es richtig einstellen?
Ich mache ein Projekt zum Problem der Autorenidentifikation. Ich hatte die tf-idf-Normalisierung angewendet, um Daten zu trainieren, und dann eine SVM für diese Daten trainiert. Wenn ich den Klassifikator verwende, sollte ich jetzt auch die Testdaten normalisieren. Ich bin der Meinung, dass das grundlegende Ziel der Normalisierung darin besteht, das …
Was ist der Unterschied zwischen val_lossund losswährend des Trainings in Keras? Z.B Epoch 1/20 1000/1000 [==============================] - 1s - loss: 0.1760, val_loss: 0.2032 Auf einigen Websites habe ich gelesen, dass Dropout bei der Validierung nicht funktioniert hat.
Ich habe schon seit einiger Zeit versucht, diese Pakete zum Laufen zu bringen, aber ohne Erfolg. Grundsätzlich ist der Fehler: GraphViz's Executables not found EDIT : Ich hatte logursprünglich kein Terminal mit dem Fehler gepostet . Ich verwende es Ubuntujetzt, damit ich nicht genau den Fehler reproduzieren kann, den ich …
Ich erstelle einen Workflow zum Erstellen von Modellen für maschinelles Lernen (in meinem Fall mit Python pandasund sklearnPaketen) aus Daten, die aus einer sehr großen Datenbank (hier Vertica über SQL und pyodbc) abgerufen wurden , und ein wichtiger Schritt in diesem Prozess besteht darin, fehlende Daten zu unterstellen Werte der …
Ich bin mir bewusst, dass Keras als High-Level-Schnittstelle zu TensorFlow dient. Aber es scheint mir, dass Keras viele Funktionen selbst ausführen kann (Dateneingabe, Modellerstellung, Schulung, Bewertung). Darüber hinaus kann ein Teil der TensorFlow-Funktionalität direkt auf Keras portiert werden (z. B. ist es möglich, eine tf-Metrik oder eine Verlustfunktion in Keras …
Ich habe einen Artikel in Kaggle-Blogs gelesen. Wiederholt erwähnt der Autor "LB-Punktzahl" und "LB-Fit" als Maß für die Effektivität des maschinellen Lernens (zusammen mit der CV-Punktzahl). Bei einer Recherche nach der Bedeutung von 'LB' habe ich viel Zeit darauf verwendet, dass die Leute es im Allgemeinen direkt als LB bezeichnen, …
Ich fange an, maschinelles Lernen von der Tensorflow-Website zu lernen. Ich habe ein sehr sehr rudimentäres Verständnis des Ablaufs entwickelt, dem ein vertieftes Lernprogramm folgt (mit dieser Methode lerne ich schnell, anstatt Bücher und große Artikel zu lesen). Es gibt ein paar verwirrende Dinge, auf die ich gestoßen bin, zwei …
Ich spiele ein bisschen mit Convnets. Insbesondere verwende ich den Datensatz kaggle cats-vs-dogs, der aus 25000 Bildern besteht, die entweder als Katze oder als Hund (jeweils 12500) gekennzeichnet sind. Ich habe es geschafft, mit meinem Testset eine Klassifizierungsgenauigkeit von ca. 85% zu erreichen, habe mir jedoch das Ziel gesetzt, eine …
In NLP gibt es das Konzept, Gazetteerdas zum Erstellen von Anmerkungen sehr nützlich sein kann. So weit ich das verstehe: Ein Gazetteer besteht aus einer Reihe von Listen mit Namen von Entitäten wie Städten, Organisationen, Wochentagen usw. Diese Listen werden verwendet, um Vorkommen dieser Namen im Text zu finden, z. …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.