Data Science

Fragen und Antworten für Data Science-Experten, Machine Learning-Spezialisten und alle, die mehr über das Feld erfahren möchten

1
Zeitreihenvorhersage mit LSTMs: Wichtigkeit, Zeitreihen stationär zu machen
In diesem Link zu Stationarität und Differenzierung wurde erwähnt, dass Modelle wie ARIMA eine stationäre Zeitreihe für die Vorhersage benötigen, da ihre statistischen Eigenschaften wie Mittelwert, Varianz, Autokorrelation usw. über die Zeit konstant sind. Da RNNs besser in der Lage sind, nichtlineare Beziehungen zu lernen ( wie hier angegeben: Das …


2
Wortvorhersage mit dem Word2vec-Modell
Bei einem Satz: „Wenn ich das öffnen ?? Tür es beginnt Heizung automatisch“ Ich möchte die Liste der möglichen Wörter in bekommen? mit einer Wahrscheinlichkeit. Das Grundkonzept, das im word2vec-Modell verwendet wird, besteht darin, ein Wort im gegebenen Umgebungskontext "vorherzusagen". Was ist die richtige Operation für Kontextvektoren, wenn das Modell …




14
Data Science-Konferenzen?
Dies ist eine ähnliche Frage wie die Frage zu Statistikkonferenzen bei CrossValidated Was sind die wichtigsten jährlichen Data Science-Konferenzen? Regeln: Fügen Sie einen Link zur Konferenz hinzu Bitte fügen Sie Links für die Vorträge bei (sei es Youtube, die Konferenzseite oder eine andere Video-Streaming-Seite).
20 community 


3
Extraktion von Schlüsselwörtern / Ausdrücken aus Text mithilfe von Deep Learning-Bibliotheken
Vielleicht ist das zu weit gefasst, aber ich suche nach Hinweisen, wie man Deep Learning in einer Aufgabe zur Zusammenfassung von Texten einsetzt. Ich habe bereits eine Textzusammenfassung mit Standard-Worthäufigkeitsansätzen und Satz-Ranking implementiert, möchte jedoch die Möglichkeit untersuchen, für diese Aufgabe Deep-Learning-Techniken zu verwenden. Ich habe auch einige Implementierungen auf …

4
Wie kann ich die semantische Ähnlichkeit von Wörtern messen?
Was ist der beste Weg, um die semantische Ähnlichkeit von Wörtern herauszufinden? Word2Vec ist okay, aber nicht ideal: # Using the 840B word Common Crawl GloVe vectors with gensim: # 'hot' is closer to 'cold' than 'warm' In [7]: model.similarity('hot', 'cold') Out[7]: 0.59720456121072973 In [8]: model.similarity('hot', 'warm') Out[8]: 0.56784095376659627 # …

3
Was ist der Unterschied zwischen Textklassifizierung und Themenmodellen?
Ich kenne den Unterschied zwischen Clustering und Klassifikation beim maschinellen Lernen, verstehe aber nicht den Unterschied zwischen Textklassifikation und Themenmodellierung für Dokumente. Kann ich die Themenmodellierung über Dokumenten verwenden, um ein Thema zu identifizieren? Kann ich Klassifizierungsmethoden verwenden, um den Text in diesen Dokumenten zu klassifizieren?

2
Keras gegen tf.keras
Ich bin etwas verwirrt, wenn ich für mein neues Forschungsprojekt zwischen Keras (keras-team / keras) und tf.keras (tensorflow / tensorflow / python / keras /) wähle. Es gibt eine Debatte, in der Keras niemandem gehört, daher können die Leute gerne dazu beitragen, und es wird in Zukunft viel einfacher sein, …

4
Verwenden von TensorFlow mit Intel GPU
Ich bin ein Neuling im tiefen Lernen. Gibt es jetzt eine Möglichkeit, TensorFlow mit Intel-GPUs zu verwenden? Wenn ja, bitte weisen Sie mich in die richtige Richtung. Wenn nicht, teilen Sie mir bitte mit, welches Framework (Keras, Theano usw.) ich für meinen Intel Corporation Xeon E3-1200 v3 / 4. Gen …
20 tensorflow  keras  theano  gpu 

3
StandardScaler vor und nach dem Aufteilen von Daten
Als ich über das Verwenden las StandardScaler, sagten die meisten Empfehlungen, dass Sie verwenden sollten, StandardScaler bevor Sie die Daten in Zug / Test aufteilen, aber als ich einige der online veröffentlichten Codes überprüfte (mit sklearn), gab es zwei Hauptverwendungen. 1- Mit StandardScalerauf alle Daten. Z.B from sklearn.preprocessing import StandardScaler …

1
Soll man heiße Vektoren mit numerischen Attributen skalieren
Im Falle einer Kombination von kategorialen und numerischen Attributen konvertiere ich die kategorialen Attribute normalerweise in einen heißen Vektor. Meine Frage ist, lasse ich diese Vektoren unverändert und skaliere die numerischen Attribute durch Standardisierung / Normalisierung, oder sollte ich die einen heißen Vektoren zusammen mit den numerischen Attributen skalieren?

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.