Data Science

Fragen und Antworten für Data Science-Experten, Machine Learning-Spezialisten und alle, die mehr über das Feld erfahren möchten


5
Was sind hilfreiche Anmerkungswerkzeuge (falls vorhanden)?
Ich suche nach Tools, mit denen ich und mein Team Trainingssätze kommentieren können. Ich arbeite in einer Umgebung mit großen Datenmengen, von denen einige un- oder halbstrukturiert sind. In vielen Fällen gibt es Registrierungen, die helfen, eine fundierte Wahrheit zu finden. In vielen Fällen wird jedoch ein kuratierter Satz benötigt, …

2
Vorhersage der Aufgabendauer
Ich versuche, ein Regressionsmodell zu erstellen, das die Dauer einer Aufgabe vorhersagt. Die Trainingsdaten, die ich habe, bestehen aus ungefähr 40.000 erledigten Aufgaben mit diesen Variablen: Wer hat die Aufgabe ausgeführt (~ 250 verschiedene Personen) Für welchen Teil (Teilprojekt) des Projekts wurde die Aufgabe ausgeführt (~ 20 verschiedene Teile)? Die …




2
Wie verwende ich Cohens Kappa als Bewertungsmetrik in GridSearchCV in Scikit Learn?
Ich habe ein Klassenungleichgewicht im Verhältnis 1:15, dh eine sehr niedrige Ereignisrate. Um die Abstimmungsparameter von GBM in Scikit Learn auszuwählen, möchte ich Kappa anstelle der F1-Punktzahl verwenden. Mein Verständnis ist, dass Kappa eine bessere Metrik als die F1-Punktzahl für das Klassenungleichgewicht ist. Aber ich konnte Kappa als Evaluierungsmetrik in …

1
Was ist die beste Leistungsmetrik, die beim Ausgleichen von Datensätzen mithilfe der SMOTE-Technik verwendet wird?
Ich habe die Smote-Technik verwendet, um meinen Datensatz zu überabtasten, und jetzt habe ich einen ausgeglichenen Datensatz. Das Problem, mit dem ich konfrontiert war, ist, dass die Leistungsmetriken; Präzision, Rückruf, f1-Messung und Genauigkeit im unausgeglichenen Datensatz werden besser ausgeführt als bei einem ausgeglichenen Datensatz. Mit welcher Messung kann ich zeigen, …

1
Der ModelCheckpoint von keras funktioniert nicht
Ich versuche, ein Modell in Keras zu trainieren, und verwende ModelCheckpoint , um das beste Modell gemäß einer überwachten Validierungsmetrik (in meinem Fall dem Jaccard-Index ) zu speichern . Während ich sehe, dass sich das Modell im Tensorboard verbessert, funktioniert es überhaupt nicht, wenn ich versuche, die Gewichte zu laden …
8 keras  convnet 

1
Kategorisierung von Ansätzen zum Umgang mit unausgeglichenen Klassen
Was ist der beste Weg, um die Ansätze zu kategorisieren, die entwickelt wurden, um das Problem der Ungleichgewichtsklassen zu lösen? Dieser Artikel kategorisiert sie in: Vorverarbeitung: umfasst Oversampling, Undersampling und Hybridmethoden, Kostensensitives Lernen: Umfasst direkte Methoden und Meta-Lernen, das letztere weiter in Schwellenwerte und Stichproben unterteilt. Ensemble-Techniken: Umfasst kostensensitive Ensembles …



5
Tutorials zu Themenmodellen und LDA
Ich würde gerne wissen, ob Sie Leute einige gute Tutorials (schnell und unkompliziert) über Themenmodelle und LDA haben, die intuitiv lehren, wie man einige Parameter einstellt, was sie bedeuten und wenn möglich, mit einigen realen Beispielen.

2
Warum sagt die Gradient Boosting-Regression negative Werte voraus, wenn mein Trainingssatz keine negativen y-Werte enthält?
Als ich die Anzahl der Bäume erhöhe in scikit lernen ist GradientBoostingRegressor, erhalte ich negative Prognosen, auch wenn es in meiner Ausbildung oder Testsatz keine negativen Werte sind. Ich habe ungefähr 10 Funktionen, von denen die meisten binär sind. Einige der Parameter, die ich eingestellt habe, waren: die Anzahl der …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.