Data Science

2

Warum führt die Lernrate dazu, dass die Gewichte meines neuronalen Netzwerks in die Höhe schnellen?

Ich benutze Tensorflow, um einfache neuronale Netze für ein bisschen Forschung zu schreiben, und ich hatte während des Trainings viele Probleme mit 'Nan'-Gewichten. Ich habe viele verschiedene Lösungen ausprobiert, wie das Ändern des Optimierers, das Ändern des Verlusts, der Datengröße usw., aber ohne Erfolg. Schließlich bemerkte ich, dass eine Änderung …

9 machine-learning python tensorflow optimization gradient-descent

2

Merkmale von Wortvektoren in word2vec

Ich versuche eine Stimmungsanalyse durchzuführen. Um die Wörter in Wortvektoren umzuwandeln, verwende ich das word2vec-Modell. Angenommen, ich habe alle Sätze in einer Liste mit dem Namen "Sätze" und übergebe diese Sätze wie folgt an word2vec: model = word2vec.Word2Vec(sentences, workers=4 , min_count=40, size=300, window=5, sample=1e-3) Da ich keine Ahnung von Wortvektoren …

9 machine-learning deep-learning word-embeddings word2vec sentiment-analysis

1

Wie gehe ich mit anonym skalierten numerischen Prädiktoren an den Wettbewerb numer.ai heran?

Numer.ai gibt es schon eine Weile und es scheint nur wenige Beiträge oder andere Diskussionen darüber im Web zu geben. Das System hat sich von Zeit zu Zeit geändert und ist heute wie folgt eingerichtet: Zugdaten (N = 96K) und Testdaten (N = 33K) mit 21 Merkmalen mit kontinuierlichen Werten …

9 machine-learning deep-learning cross-validation preprocessing competitions

3

Auswahl der Regularisierungsmethode in neuronalen Netzen

Beim Training neuronaler Netze gibt es mindestens vier Möglichkeiten, das Netz zu regulieren: L1 Regularisierung L2 Regularisierung Aussteigen Chargennormalisierung Dazu kommen natürlich auch andere Dinge wie Gewichtsverteilung und Reduzierung der Anzahl der Verbindungen, die im engeren Sinne möglicherweise keine Regularisierung darstellen. Aber wie würde man wählen, welche dieser Regularisierungsmethoden verwendet …

9 neural-network regularization

3

Welche Empfehlungs-Engine für eine Situation, in der Benutzer nur einen Bruchteil aller Elemente sehen können?

Ich möchte einem Dokumentenverwaltungssystem eine Empfehlungsfunktion hinzufügen . Es ist ein Server, auf dem die meisten Unternehmensdokumente gespeichert sind. Die Mitarbeiter durchsuchen die Weboberfläche und klicken, um die gewünschten Dokumente herunterzuladen (oder online zu lesen). Jeder Mitarbeiter hat nur Zugriff auf eine Teilmenge aller Dokumente: Mein Ziel : Empfehlen Sie …

9 machine-learning recommender-system

3

Welche Algorithmen für maschinelles Lernen werden als guter Kompromiss zwischen Erklärbarkeit und Vorhersage akzeptiert?

Texte zum maschinellen Lernen, die Algorithmen wie Maschinen zur Erhöhung des Gradienten oder neuronale Netze beschreiben, kommentieren häufig, dass diese Modelle gut vorhersagbar sind, dies geht jedoch zu Lasten eines Verlustes an Erklärbarkeit oder Interpretierbarkeit. Umgekehrt werden einzelne Entscheidungsbäume und klassische Regressionsmodelle als gut erklärbar eingestuft, bieten jedoch eine (relativ) …

9 machine-learning predictive-modeling

2

Benchmark-Datensätze für die kollaborative Filterung

Ich möchte einen neuen Algorithmus für die kollaborative Filterung testen . Ein typischer Anwendungsfall besteht darin, Filme zu empfehlen, die auf den Vorlieben von Benutzern basieren, die dem jeweiligen Benutzer ähnlich sind. Welche gängigen Benchmark-Datensätze verwenden Forscher häufig, um ihre Algorithmen zu testen? Ich weiß, dass in Computer Vision häufig …

9 dataset recommender-system

3

Exportieren Sie Gewichte (Formel) aus Random Forest Regressor in Scikit-Learn

Ich habe ein Vorhersagemodell mit Scikit Learn in Python (Random Forest Regressor) trainiert und möchte die Gewichte der einzelnen Features irgendwie extrahieren, um ein Excel-Tool für die manuelle Vorhersage zu erstellen. Das einzige, was ich gefunden habe, ist das, model.feature_importances_aber es hilft nicht. Gibt es eine Möglichkeit, dies zu erreichen? …

9 python predictive-modeling regression random-forest scikit-learn

1

Welche Beziehung besteht zwischen einer SVM und einem Scharnierverlust?

Mein Kollege und ich versuchen, uns mit dem Unterschied zwischen logistischer Regression und einer SVM auseinanderzusetzen. Offensichtlich optimieren sie verschiedene Zielfunktionen. Ist eine SVM so einfach wie zu sagen, dass sie ein diskriminierender Klassifikator ist, der einfach den Scharnierverlust optimiert? Oder ist es komplexer als das? Wie kommen die Unterstützungsvektoren …

9 svm logistic-regression hinge-loss

7

Python-Bibliothek, die die Verwirrungsmatrix für die Klassifizierung mehrerer Labels berechnen kann

Ich suche nach einer Python-Bibliothek, die die Verwirrungsmatrix für die Klassifizierung mehrerer Labels berechnen kann . Zu Ihrer Information: scikit-learn unterstützt kein Multi-Label für Verwirrungsmatrix) Was ist der Unterschied zwischen Multiclass und Multilabel Problem?

9 python software-recommendation multilabel-classification

2

Gibt es Studien, die Dropout im Vergleich zu anderen Regularisierungen untersuchen?

Gibt es Veröffentlichungen, die Unterschiede in den Regularisierungsmethoden für neuronale Netze zeigen, vorzugsweise in verschiedenen Domänen (oder zumindest in verschiedenen Datensätzen)? Ich frage, weil ich derzeit das Gefühl habe, dass die meisten Leute nur Aussetzer zur Regularisierung in der Bildverarbeitung verwenden. Ich möchte prüfen, ob es einen Grund gibt (nicht), …

9 neural-network computer-vision convnet regularization dropout

2

Wie modelliere ich das Kaufverhalten eines Nutzers bei Amazon?

Für unser Abschlussprojekt in Data Science haben wir Folgendes vorgeschlagen: Geben Sie den Amazon Reviews-Datensatz an . Wir planen, einen Algorithmus zu entwickeln (der grob auf dem personalisierten PageRank basiert), der eine strategische Position für die Platzierung von Anzeigen bei Amazon festlegt. Zum Beispiel gibt es bei Amazon Millionen von …

9 machine-learning data-mining dataset recommender-system

2

Multivariate lineare Regression in Python

Ich suche nach einem Python-Paket, das eine multivariate lineare Regression implementiert. (Terminologische Anmerkung: Multivariate Regression befasst sich mit dem Fall, dass es mehr als eine abhängige Variable gibt, während multiple Regression den Fall behandelt, in dem es eine abhängige Variable, aber mehr als eine unabhängige Variable gibt.)

9 python regression library software-recommendation

3

Tutorial zur Stimmungsanalyse

Ich versuche, die Stimmungsanalyse zu verstehen und sie in einer beliebigen Sprache (R, Python usw.) anzuwenden. Ich würde gerne wissen, ob es im Internet einen guten Platz für ein Tutorial gibt, dem ich folgen kann. Ich habe gegoogelt, aber ich war nicht sehr zufrieden, weil es sich nicht um Tutorials …

9 machine-learning reference-request sentiment-analysis

2

Klassifikation von Vektorsequenzen

Mein Datensatz besteht aus Vektorsequenzen. Jeder Vektor hat 50 reelle Dimensionen. Die Anzahl der Vektoren in einer Sequenz reicht von 3-5 bis 10-15. Mit anderen Worten ist die Länge einer Sequenz nicht festgelegt. Einige der Sequenzen (keine Vektoren!) Sind mit einem Klassenlabel versehen. Meine Aufgabe ist es, einen Klassifikator zu …

9 classification sequence