Data Science

2

Könnte Deep Learning verwendet werden, um die Verschlüsselung zu knacken?

Angenommen, Sie haben ein Dataset mit Millionen von Zeilen und den Attributen Nur-Text, Schlüssel und Ausgabe-Chiffretext. Könnte Deep Learning theoretisch verwendet werden, um Muster in den Ausgaben zu finden, die helfen, den Chiffretext zu entschlüsseln? Gibt es andere mögliche Ansätze?

10 machine-learning deep-learning

5

So überwinden Sie die unterschiedlichen Längen von Trainingsbeispielen bei der Arbeit mit Word Embeddings (word2vec)

Ich arbeite an der Stimmungsanalyse über Tweets mit word2vec als Wortdarstellung. Ich habe mein word2vec-Modell trainiert. Aber wenn ich meinen Klassifikator trainiere, habe ich das Problem, dass jeder Tweet eine andere Länge hat und der Klassifikator (RandomForest) alle Beispiele benötigt, um die gleiche Größe zu haben. Derzeit mittle ich für …

10 word-embeddings word2vec sentiment-analysis

1

Welche der 180 Algorithmen im Caret-Paket von R sind möglich?

Das Caret-Paket von R funktioniert mit 180 Modellen. Der Autor warnt davor, dass ein Teil des Pakets unlösbar langsam oder weniger genau sein kann als Modelle der ersten Wahl. Der Autor ist nicht falsch. Ich habe versucht, Boruta- und evtree-Modelle zu trainieren und musste aufgeben, nachdem sie> 5 Stunden in …

10 machine-learning r

1

Effekt, dass die Filtergewichte von CNN während des Backprop NICHT geändert werden

Was bewirkt es, die Filtergewichte eines CNN während der Backpropagation NICHT zu ändern? Ich habe beim Training des MNIST-Datensatzes nur die vollständig verbundenen Schichtgewichte geändert und trotzdem eine Genauigkeit von fast 99 Prozent erreicht.

9 machine-learning cnn mnist

3

Frühzeitiger Stopp bei Validierungsverlust oder Genauigkeit?

Ich trainiere derzeit ein neuronales Netzwerk und kann mich nicht entscheiden, welches zur Implementierung meiner Early-Stop-Kriterien verwendet werden soll: Validierungsverlust oder Metriken wie Genauigkeit / f1score / auc / was auch immer auf dem Validierungssatz berechnet. Bei meinen Recherchen stieß ich auf Artikel, die beide Standpunkte verteidigten. Keras scheint standardmäßig …

9 machine-learning neural-network deep-learning classification

5

So erstellen Sie eine gute Liste von Stoppwörtern

Ich suche nach Hinweisen, wie man eine Liste von Stoppwörtern kuratiert. Kennt / kann jemand eine gute Methode empfehlen, um Stoppwortlisten zur Vorverarbeitung und Filterung aus dem Datensatz selbst zu extrahieren? Die Daten: Eine große Menge menschlicher Texteingaben mit variabler Länge (Suchbegriffe und ganze Sätze (bis zu 200 Zeichen)) über …

9 data-mining nlp information-retrieval language-model

2

Ist dieser Neo4j-Vergleich mit der RDBMS-Ausführungszeit korrekt?

Hintergrund: Das Folgende stammt aus dem Buch Graph Databases , das einen Leistungstest behandelt, der im Buch Neo4j in Aktion erwähnt wird : Beziehungen in einem Diagramm bilden natürlich Pfade. Beim Abfragen oder Durchlaufen des Diagramms werden folgende Pfade verwendet. Aufgrund der grundsätzlich pfadorientierten Natur des Datenmodells sind die meisten …

9 databases nosql neo4j

3

Was sind Rs Speicherbeschränkungen?

Bei der Überprüfung von " Applied Predictive Modeling " stellt ein Prüfer fest : Eine Kritik, die ich an der Pädagogik des statistischen Lernens (SL) habe, ist das Fehlen von Überlegungen zur Rechenleistung bei der Bewertung verschiedener Modellierungstechniken. Mit seinen Schwerpunkten auf Bootstrapping und Kreuzvalidierung zum Tunen / Testen von …

9 apache-hadoop r

2

Was sind die Unterschiede zwischen Convolutional1D, Convolutional2D und Convolutional3D?

Ich habe etwas über Faltungs-Neuronale Netze gelernt. Bei der Betrachtung von KerasBeispielen bin ich auf drei verschiedene Faltungsmethoden gestoßen. Nämlich 1D, 2D & 3D. Was sind die Unterschiede zwischen diesen drei Schichten? Was sind ihre Anwendungsfälle? Gibt es einige Links oder Verweise, um ihre Anwendungsfälle zu zeigen?

9 machine-learning neural-network deep-learning keras cnn

1

Was versteht man unter "Verteilt" für eine Bibliothek zur Erhöhung des Gradienten?

Ich überprüfe die XGBoost-Dokumentation und es wird angegeben, dass XGBoost eine optimierte verteilte Gradienten-Boosting-Bibliothek ist. Was ist mit verteilt gemeint? Einen schönen Tag noch

9 xgboost distributed boosting

2

Bedeutet Batch-Normalisierung, dass Sigmoide besser funktionieren als ReLUs?

Batch-Normalisierung und ReLUs sind beide Lösungen für das Problem des verschwindenden Gradienten. Wenn wir die Chargennormalisierung verwenden, sollten wir dann Sigmoide verwenden? Oder gibt es Funktionen von ReLUs, die sie auch bei Verwendung von Batchnorm lohnenswert machen? Ich nehme an, dass die in Batchnorm durchgeführte Normalisierung keine negativen Aktivierungen aussendet. …

9 deep-learning batch-normalization

4

SGDClassifier: Online Learning / Partial_fit mit einem bisher unbekannten Label

Mein Trainingsset enthält ungefähr 50.000 Einträge, mit denen ich ein erstes Lernen mache. Wöchentlich werden ~ 5.000 Einträge hinzugefügt. aber der gleiche Betrag "verschwindet" (da es sich um Benutzerdaten handelt, die nach einiger Zeit gelöscht werden müssen). Daher verwende ich Online-Lernen, da ich zu einem späteren Zeitpunkt keinen Zugriff auf …

9 multiclass-classification online-learning

1

Warum lernt mein Keras-Modell, den Hintergrund zu erkennen?

Ich versuche, diese Keras-Implementierung von Deeplabv3 + auf Pascal VOC2012 mithilfe des vorab trainierten Modells (das auch für diesen Datensatz trainiert wurde) zu trainieren. Ich habe seltsame Ergebnisse mit einer Genauigkeit erzielt, die schnell auf 1,0 konvergiert: 5/5 [==============================] - 182s 36s/step - loss: 26864.4418 - acc: 0.7669 - val_loss: …

9 python deep-learning keras tensorflow

1

Kann das Reinforcement-Lernen für die Vorhersage von Zeitreihen angewendet werden?

9 time-series reinforcement-learning forecasting

2

Welche Techniken für maschinelles / tiefes Lernen / nlp werden verwendet, um ein bestimmtes Wort als Name, Handynummer, Adresse, E-Mail, Bundesstaat, Landkreis, Stadt usw. zu klassifizieren?

Ich versuche, ein intelligentes Modell zu generieren, das eine Reihe von Wörtern oder Zeichenfolgen scannen und mithilfe von maschinellem Lernen oder Deep Learning als Namen, Handynummern, Adressen, Städte, Bundesstaaten, Länder und andere Einheiten klassifizieren kann. Ich hatte nach Ansätzen gesucht, aber leider keinen Ansatz gefunden. Ich hatte versucht, mit einer …

9 machine-learning deep-learning text-mining natural-language-process