Data Science

Fragen und Antworten für Data Science-Experten, Machine Learning-Spezialisten und alle, die mehr über das Feld erfahren möchten

2
Warum führt die Lernrate dazu, dass die Gewichte meines neuronalen Netzwerks in die Höhe schnellen?
Ich benutze Tensorflow, um einfache neuronale Netze für ein bisschen Forschung zu schreiben, und ich hatte während des Trainings viele Probleme mit 'Nan'-Gewichten. Ich habe viele verschiedene Lösungen ausprobiert, wie das Ändern des Optimierers, das Ändern des Verlusts, der Datengröße usw., aber ohne Erfolg. Schließlich bemerkte ich, dass eine Änderung …

2
Merkmale von Wortvektoren in word2vec
Ich versuche eine Stimmungsanalyse durchzuführen. Um die Wörter in Wortvektoren umzuwandeln, verwende ich das word2vec-Modell. Angenommen, ich habe alle Sätze in einer Liste mit dem Namen "Sätze" und übergebe diese Sätze wie folgt an word2vec: model = word2vec.Word2Vec(sentences, workers=4 , min_count=40, size=300, window=5, sample=1e-3) Da ich keine Ahnung von Wortvektoren …


3
Auswahl der Regularisierungsmethode in neuronalen Netzen
Beim Training neuronaler Netze gibt es mindestens vier Möglichkeiten, das Netz zu regulieren: L1 Regularisierung L2 Regularisierung Aussteigen Chargennormalisierung Dazu kommen natürlich auch andere Dinge wie Gewichtsverteilung und Reduzierung der Anzahl der Verbindungen, die im engeren Sinne möglicherweise keine Regularisierung darstellen. Aber wie würde man wählen, welche dieser Regularisierungsmethoden verwendet …

3
Welche Empfehlungs-Engine für eine Situation, in der Benutzer nur einen Bruchteil aller Elemente sehen können?
Ich möchte einem Dokumentenverwaltungssystem eine Empfehlungsfunktion hinzufügen . Es ist ein Server, auf dem die meisten Unternehmensdokumente gespeichert sind. Die Mitarbeiter durchsuchen die Weboberfläche und klicken, um die gewünschten Dokumente herunterzuladen (oder online zu lesen). Jeder Mitarbeiter hat nur Zugriff auf eine Teilmenge aller Dokumente: Mein Ziel : Empfehlen Sie …

3
Welche Algorithmen für maschinelles Lernen werden als guter Kompromiss zwischen Erklärbarkeit und Vorhersage akzeptiert?
Texte zum maschinellen Lernen, die Algorithmen wie Maschinen zur Erhöhung des Gradienten oder neuronale Netze beschreiben, kommentieren häufig, dass diese Modelle gut vorhersagbar sind, dies geht jedoch zu Lasten eines Verlustes an Erklärbarkeit oder Interpretierbarkeit. Umgekehrt werden einzelne Entscheidungsbäume und klassische Regressionsmodelle als gut erklärbar eingestuft, bieten jedoch eine (relativ) …

2
Benchmark-Datensätze für die kollaborative Filterung
Ich möchte einen neuen Algorithmus für die kollaborative Filterung testen . Ein typischer Anwendungsfall besteht darin, Filme zu empfehlen, die auf den Vorlieben von Benutzern basieren, die dem jeweiligen Benutzer ähnlich sind. Welche gängigen Benchmark-Datensätze verwenden Forscher häufig, um ihre Algorithmen zu testen? Ich weiß, dass in Computer Vision häufig …

3
Exportieren Sie Gewichte (Formel) aus Random Forest Regressor in Scikit-Learn
Ich habe ein Vorhersagemodell mit Scikit Learn in Python (Random Forest Regressor) trainiert und möchte die Gewichte der einzelnen Features irgendwie extrahieren, um ein Excel-Tool für die manuelle Vorhersage zu erstellen. Das einzige, was ich gefunden habe, ist das, model.feature_importances_aber es hilft nicht. Gibt es eine Möglichkeit, dies zu erreichen? …

1
Welche Beziehung besteht zwischen einer SVM und einem Scharnierverlust?
Mein Kollege und ich versuchen, uns mit dem Unterschied zwischen logistischer Regression und einer SVM auseinanderzusetzen. Offensichtlich optimieren sie verschiedene Zielfunktionen. Ist eine SVM so einfach wie zu sagen, dass sie ein diskriminierender Klassifikator ist, der einfach den Scharnierverlust optimiert? Oder ist es komplexer als das? Wie kommen die Unterstützungsvektoren …


2
Gibt es Studien, die Dropout im Vergleich zu anderen Regularisierungen untersuchen?
Gibt es Veröffentlichungen, die Unterschiede in den Regularisierungsmethoden für neuronale Netze zeigen, vorzugsweise in verschiedenen Domänen (oder zumindest in verschiedenen Datensätzen)? Ich frage, weil ich derzeit das Gefühl habe, dass die meisten Leute nur Aussetzer zur Regularisierung in der Bildverarbeitung verwenden. Ich möchte prüfen, ob es einen Grund gibt (nicht), …


2
Multivariate lineare Regression in Python
Ich suche nach einem Python-Paket, das eine multivariate lineare Regression implementiert. (Terminologische Anmerkung: Multivariate Regression befasst sich mit dem Fall, dass es mehr als eine abhängige Variable gibt, während multiple Regression den Fall behandelt, in dem es eine abhängige Variable, aber mehr als eine unabhängige Variable gibt.)

3
Tutorial zur Stimmungsanalyse
Ich versuche, die Stimmungsanalyse zu verstehen und sie in einer beliebigen Sprache (R, Python usw.) anzuwenden. Ich würde gerne wissen, ob es im Internet einen guten Platz für ein Tutorial gibt, dem ich folgen kann. Ich habe gegoogelt, aber ich war nicht sehr zufrieden, weil es sich nicht um Tutorials …

2
Klassifikation von Vektorsequenzen
Mein Datensatz besteht aus Vektorsequenzen. Jeder Vektor hat 50 reelle Dimensionen. Die Anzahl der Vektoren in einer Sequenz reicht von 3-5 bis 10-15. Mit anderen Worten ist die Länge einer Sequenz nicht festgelegt. Einige der Sequenzen (keine Vektoren!) Sind mit einem Klassenlabel versehen. Meine Aufgabe ist es, einen Klassifikator zu …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.