Data Science

Fragen und Antworten für Data Science-Experten, Machine Learning-Spezialisten und alle, die mehr über das Feld erfahren möchten

1
XGBRegressor vs. xgboost.train großer Geschwindigkeitsunterschied?
Wenn ich mein Modell mit dem folgenden Code trainiere: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target = df[target_columns] dmatrix = xg.DMatrix(features.values, target.values, feature_names=features.columns.values) clf = xg.train(params, dmatrix) es endet in ungefähr 1 Minute. Wenn ich mein Modell mit der …


1
Heatmap auf einer Karte in Python
Mode Analytics hat eine nette Heatmap-Funktion ( https://community.modeanalytics.com/gallery/geographic-heat-map/ ). Es ist jedoch nicht förderlich, Karten zu vergleichen (nur eine pro Bericht). Sie ermöglichen es, Daten einfach in ein Python-Notizbuch zu ziehen. Und dann kann jedes Bild in Python einfach zu einem Bericht hinzugefügt werden. Meine Frage lautet also: Wie erstelle …



3
Doc2vec (gensim) - Wie kann ich auf das Etikett von unsichtbaren Sätzen schließen?
https://radimrehurek.com/gensim/models/doc2vec.html Zum Beispiel, wenn wir doc2vec mit trainiert haben "aaaaaAAAAAaaaaaa" - "Label 1" "BbbbbbBBBBbbbbb" - "label 2" Können wir mit Doc2vec auf „aaaaAAAAaaaaAA“ als Label 1 schließen? Ich weiß, dass Doc2vec Wortvektoren und Beschriftungsvektoren trainieren kann. Können wir unter Verwendung dieser Vektoren auf unsichtbare Sätze (Kombination von trainierten Wörtern) schließen, …
13 gensim 


1
Erkennen Sie eine Grammatik in einer Folge von unscharfen Token
Ich habe Textdokumente, die hauptsächlich Listen von Gegenständen enthalten. Jedes Objekt ist eine Gruppe von mehreren Token verschiedener Typen: Vorname, Nachname, Geburtsdatum, Telefonnummer, Stadt, Beruf usw. Ein Token ist eine Gruppe von Wörtern. Artikel können in mehreren Zeilen liegen. Elemente aus einem Dokument haben ungefähr dieselbe Tokensyntax, müssen jedoch nicht …

1
Was ist der Unterschied zwischen einem (dynamischen) Bayes-Netzwerk und einem HMM?
Ich habe gelesen, dass HMMs, Partikelfilter und Kalman-Filter Spezialfälle von dynamischen Bayes-Netzwerken sind. Ich kenne jedoch nur HMMs und sehe keinen Unterschied zu dynamischen Bayes-Netzwerken. Könnte jemand bitte erklären? Es wäre schön, wenn Ihre Antwort ähnlich wie die folgende aussehen könnte, aber für bayes Networks: Versteckte Markov-Modelle Ein Hidden Markov …


3
Muss ich bei einer unsymmetrischen Klasse eine Stichprobe für meine Validierungs- / Testdatensätze verwenden?
Ich bin ein Anfänger im maschinellen Lernen und stehe vor einer Situation. Ich arbeite an einem Real Time Bidding-Problem mit dem IPinYou-Dataset und versuche, eine Klickvorhersage zu erstellen. Die Sache ist, wie Sie vielleicht wissen, dass der Datensatz sehr unausgeglichen ist: Rund 1300 negative Beispiele (ohne Klick) für 1 positives …

2
Effizienter Algorithmus zur Berechnung der ROC-Kurve für einen Klassifikator, der aus einem Ensemble von disjunkten Klassifikatoren besteht
Angenommen, ich habe Klassifizierer C_1 ... C_n, die in dem Sinne disjunkt sind, dass keine zwei bei derselben Eingabe true zurückgeben (z. B. die Knoten in einem Entscheidungsbaum). Ich möchte einen neuen Klassifikator erstellen, der die Vereinigung einer Teilmenge von diesen darstellt (z. B. möchte ich entscheiden, welche Blätter eines …
13 algorithms 


7
Ich bin Programmierer, wie komme ich in den Bereich Data Science?
Zunächst klingt dieser Begriff so dunkel. Sowieso. Ich bin ein Software-Programmierer. Eine der Sprachen, die ich codieren kann, ist Python. Apropos Daten Ich kann SQL und Data Scraping verwenden. Was ich bisher herausgefunden habe, nachdem ich so viele Artikel gelesen habe, in denen Data Science nur gut ist: 1- Statistiken …
13 beginner  career 


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.