Data Science

Fragen und Antworten für Data Science-Experten, Machine Learning-Spezialisten und alle, die mehr über das Feld erfahren möchten

3
Welche Kenntnisse benötige ich, um ein einfaches KI-Programm zum Spielen eines Spiels zu schreiben?
Ich bin ein B.Sc-Absolvent. Einer meiner Kurse war "Einführung in das maschinelle Lernen", und ich wollte immer ein persönliches Projekt in diesem Fach machen. Ich habe kürzlich von verschiedenen KI-Trainings gehört, um Spiele wie Mario, Go usw. zu spielen. Welche Kenntnisse muss ich erwerben, um ein einfaches KI-Programm zum Spielen …

1
Maschinelles Lernen: Gedichte schreiben
Ich bin ein Student des maschinellen Lernens und in diesen Tagen habe ich versucht zu lernen, wie man die TensorFlow-Bibliothek benutzt. Ich habe verschiedene Tutorials und Versuche mit Tensorflow durchlaufen und dachte, der beste Weg, dies wirklich zu lernen, wäre, es in einem kleinen eigenen Projekt zu verwenden. Ich habe …

1
Fragen beim Übergang vom Vanilla Neural Network zum Recurrent Neural Network
Ich habe kürzlich erfahren, wie ein neuronales Vanille-Netzwerk mit einer bestimmten Anzahl von Eingaben, versteckten Knoten und der gleichen Anzahl von Ausgaben wie Eingaben funktionieren würde. Ich habe mir verschiedene Beiträge angesehen, die sich jetzt auf wiederkehrende neuronale Netze beziehen, und ich verstehe das Konzept dahinter, aber ich verstehe bestimmte …

4
Unausgeglichene Klasse: class_weight für ML-Algorithmen in Spark MLLib
In Python Sklearn gibt es mehrere Algorithmen (z. B. Regression, zufällige Gesamtstruktur usw.), die den Parameter class_weight haben, um unausgeglichene Daten zu verarbeiten. Ich finde jedoch keinen solchen Parameter für die MLLib-Algorithmen. Gibt es einen Plan zur Implementierung von class_weight für einen MLLib-Algorithmus? Oder gibt es in MLLib einen Ansatz …


2
Kann es bei Advanced Optimization-Algorithmen zu einer Überanpassung kommen?
Während eines Online-Kurses über maschinelles Lernen von Andrew Ng auf coursera stieß ich auf ein Thema namens Überanpassung . Ich weiß, dass es auftreten kann, wenn ein Gradientenabstieg in einer linearen oder logistischen Regression verwendet wird, aber kann es auftreten, wenn erweiterte Optimierungsalgorithmen wie "Gradient konjugieren", "BFGS" und "L-BFGS" verwendet …

1
Warum verwenden Trainings-RNNs nicht 100% der GPU?
Ich frage mich, warum das Training von RNNs normalerweise nicht 100% der GPU verwendet. Wenn ich diesen RNN-Benchmark beispielsweise auf einem Maxwell Titan X unter Ubuntu 14.04.4 LTS x64 ausführe, liegt die GPU-Auslastung unter 90%: Der Benchmark wurde mit dem folgenden Befehl gestartet: python rnn.py -n 'fastlstm' -l 1024 -s …

2
Indizes in Pandas zählen
Ich denke, dies ist eine rudimentäre Frage, aber ich bin sehr neu darin und konnte sie einfach nicht knacken / die Antwort finden. Letztendlich versuche ich hier, eindeutige Werte für eine bestimmte Spalte zu zählen und dann zu bestimmen, welche dieser eindeutigen Werte mehr als einen eindeutigen Wert in einer …


3
Wie wird das Textclustering bewertet?
Welche Metriken können zur Bewertung von Textclustering-Modellen verwendet werden? Ich habe tf-idf+ k-means, tf-idf+ hierarchical clustering, doc2vec+ k-means (metric is cosine similarity), doc2vec+ verwendet hierarchical clustering (metric is cosine similarity). Wie kann man entscheiden, welches Modell das beste ist?


2
Was ist eine LSTM-LM-Formulierung?
Ich lese diesen Artikel "Sequence to Sequence Learning mit neuronalen Netzen" http://papers.nips.cc/paper/5346-sequence-to-sequence-learning-with-neural-networks.pdf Unter "2. Das Modell" steht: Das LSTM berechnet diese bedingte Wahrscheinlichkeit, indem es zuerst die feste dimensionale Darstellung v der Eingabesequenz (x1, ..., xT) erhält, die durch den letzten verborgenen Zustand des LSTM gegeben ist, und dann die …


1
Mindestanzahl von Bäumen für den Random Forest-Klassifikator
Ich suche nach einer theoretischen oder experimentellen Schätzung der Untergrenze für die Anzahl der Bäume in einem Random Forest-Klassifikator. Normalerweise teste ich verschiedene Kombinationen und wähle die aus, die (mithilfe der Kreuzvalidierung) das median beste Ergebnis liefert. Ich denke jedoch, dass es bei Beobachtungen und Merkmalen eine Untergrenze für die …

3
Verschachtelte Kreuzvalidierung und Auswahl des besten Regressionsmodells - ist dies der richtige SKLearn-Prozess?
Wenn ich das richtig verstehe, kann mir Nested-CV dabei helfen, zu bewerten, welcher Modell- und Hyperparameter-Optimierungsprozess am besten ist. Die innere Schleife ( GridSearchCV) findet die besten Hyperparameter, und die äußere Schleife ( cross_val_score) wertet den Algorithmus zur Optimierung der Hyperparameter aus. Ich wähle dann aus der äußeren Schleife aus, …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.