Data Science

3

Warum verwendet die Logistikfunktion e anstelle von 2?

Die Sigmoidfunktion könnte als Aktivierungsfunktion beim maschinellen Lernen verwendet werden. S(x)=11+e−x=exex+1.S(x)=11+e−x=exex+1.{\displaystyle S(x)={\frac {1}{1+e^{-x}}}={\frac {e^{x}}{e^{x}+1}}.} Wenn e durch 2 ersetzt wird, def sigmoid2(z): return 1/(1+2**(-z)) x = np.arange(-9,9,dtype=float) y = sigmoid2(x) plt.scatter(x,y) Die Handlung sieht ähnlich aus. Warum wird die Logistikfunktion verwendet? eee eher als 2?

7 machine-learning deep-learning

1

Lemmatisierung gegen Stemming

Ich habe über beide Techniken gelesen, um die Wurzel des Wortes zu finden, aber wie ziehen wir eine der anderen vor? Ist "Lemmatisierung" immer besser als "Stemming"?

7 nlp natural-language-process stanford-nlp

3

So erkennen Sie Pappkartons mit Neural Network

Ich versuche, ein neuronales Netzwerk darin zu schulen, wie man Pappkartons zusammen mit mehreren Klassen von Personen (Personen) erkennt. Obwohl es einfach ist, Personen zu erkennen und korrekt zu klassifizieren, ist es unglaublich schwierig, Pappkartons zu erkennen. Die Boxen sehen folgendermaßen aus: Mein Verdacht ist, dass die Box eines Objekts …

7 neural-network deep-learning cnn image-classification

3

Finden Sie heraus, ob die beiden Datensätze nahe beieinander liegen

Ich habe die folgenden drei Datensätze. data_a=[0.21,0.24,0.36,0.56,0.67,0.72,0.74,0.83,0.84,0.87,0.91,0.94,0.97] data_b=[0.13,0.21,0.27,0.34,0.36,0.45,0.49,0.65,0.66,0.90] data_c=[0.14,0.18,0.19,0.33,0.45,0.47,0.55,0.75,0.78,0.82] data_a sind reale Daten und die anderen beiden sind die simulierten. Hier versuche ich zu überprüfen, welches (data_b oder data_c) dem data_a am nächsten kommt oder ihm sehr ähnlich ist. Derzeit mache ich es visuell und mit ks_2samp Test (Python). Visuell …

7 python statistics visualization simulation

3

Docker für Data Science

Ich habe kürzlich angefangen, Artikel über Docker zu lesen. In der Datenwissenschaft ist Docker für mich nützlich, weil: 1) Sie haben eine völlig andere Umgebung, die Sie vor Problemen mit Bibliotheken und Abhängigkeiten schützt. 2) Wenn Ihre Anwendung beispielsweise die Datenbank Ihres Unternehmens ändert, möchten Sie zunächst sicherstellen, dass der …

7 data

1

Ist es in Ordnung zu versuchen, den besten PCA k-Parameter zu finden, wie wir es mit anderen Hyperparametern tun?

Die Hauptkomponentenanalyse (PCA) wird verwendet, um n-dimensionale Daten auf k-dimensionale Daten zu reduzieren, um das maschinelle Lernen zu beschleunigen. Nachdem PCA angewendet wurde, kann überprüft werden, wie viel von der Varianz des ursprünglichen Datensatzes im resultierenden Datensatz verbleibt. Ein gemeinsames Ziel ist es, die Varianz zwischen 90% und 99% zu …

7 machine-learning pca hyperparameter

2

Was sind die Nachteile einer linksgerichteten Verteilung?

Ich arbeite derzeit an einem Klassifizierungsproblem und habe eine numerische Spalte, die schief bleibt. Ich habe viele Beiträge gelesen, in denen Leute empfehlen, eine Protokolltransformation oder eine Boxcox-Transformation durchzuführen, um die linke Schiefe zu beheben. Also habe ich mich gefragt, was passieren würde, wenn ich die Schiefe so belassen würde, …

7 machine-learning python

4

Kann das Problem des verschwindenden Gradienten gelöst werden, indem die Eingabe von tanh mit einem Koeffizienten multipliziert wird?

Nach meinem Verständnis tritt das Problem des verschwindenden Gradienten beim Training neuronaler Netze auf, wenn der Gradient jeder Aktivierungsfunktion kleiner als 1 ist, so dass das Produkt dieser Gradienten sehr klein wird, wenn Korrekturen durch viele Schichten zurückpropagiert werden. Ich weiß, dass es andere Lösungen wie eine Gleichrichteraktivierungsfunktion gibt , …

7 machine-learning neural-network deep-learning activation-function

1

Gibt es bereits tatsächliche kommerzielle Verwendungen von GANs?

Als ich im Internet recherchierte, fand ich viele wissenschaftliche Arbeiten, Ideen und Experimente zu GANs. Aber ich konnte kein einziges Beispiel dafür finden, dass es bereits kommerziell genutzt wird. Können Sie im ersten Quartal Beispiele für Unternehmen nennen, die bereits GANs in ihrem Produkt verwenden? F2 Wenn Sie keine Beispiele …

7 gan

2

Validierung vs. Test vs. Trainingsgenauigkeit. Welches sollte ich vergleichen, um Überanpassung zu beanspruchen?

Ich habe in den verschiedenen Antworten hier und im Internet gelesen, dass eine Kreuzvalidierung hilfreich ist, um anzuzeigen, ob sich das Modell gut verallgemeinern lässt oder nicht und ob es zu einer Überanpassung kommt. Aber ich bin verwirrt darüber, welche zwei Genauigkeiten / Fehler unter Test / Training / Validierung …

7 machine-learning cross-validation accuracy overfitting

1

Auf einem mehrsprachigen Stimmungskorpus

Ich möchte einen Stimmungskorpus für Nachrichtenartikel in mehreren Sprachen (~ 100.000 pro Sprache für ein Experiment zum maschinellen Lernen) zusammenstellen, in dem jeder Artikel als positiv, neutral oder negativ gekennzeichnet ist. Ich habe hoch und niedrig gesucht, konnte aber so etwas nicht finden. Ich habe bereits die Nachrichtenartikel in jeder …

7 machine-learning python nlp dataset sentiment-analysis

5

Wann Mittelwert gegen Median zu verwenden ist

Ich bin neu in Data Science und Statistiken, daher scheint dies eine Anfängerfrage zu sein. Ich arbeite an einem Datensatz, bei dem die Twitter-Follower des Benutzers pro Tag zunehmen. Ich möchte das durchschnittliche Wachstum messen, das er über einen bestimmten Zeitraum hatte, indem ich den Mittelwert des Wachstums ermittelt habe. …

7 statistics descriptive-statistics

3

Wie konvertiere ich verschachtelte Listen in eine einzelne Liste in Python? [geschlossen]

Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Daten Wissenschaft Stapel Börse. Geschlossen vor 2 Jahren . Ich habe eine Liste, die ID-Nummer enthält. Einige Elemente der Liste sind eine …

7 python

1

Wie kann ich nachweisen, dass die Engpassschicht meines CNN-Auto-Encoders nützliche Informationen enthält?

Ich verwende den CNN-Autoencoder, um eine Zustandsrepräsentationsschicht zu erstellen, die ich später in meinen Verstärkungsagenten einspeisen werde. Also habe ich meinen CNN-Autoencoder trainiert und er gibt nette Zustandsdarstellungen. Aber ich habe folgende Fragen: Kann meine Autoencoder-Schicht überpasst werden? Wenn es eine Überanpassung gibt, führt dies zu Abfallinformationen in meiner Engpassschicht?

7 deep-learning autoencoder

1

Wie kann die Form der Eingabe-Features festgelegt werden, wenn jede Datendatei unterschiedlich lang ist?

Um Hilfe zu verstehen mich die Vorteile und Nachteile der decision trees, KNN, Neural Networks, Ich wollte einen einfachen Klassifizierer , dass stuft in 2 Klassen (bauen Bird Soundund Non-Bird Sound) mit allen oben 3 Methoden. Also habe ich einen Sound-Datensatz von kaggle heruntergeladen und pysoundfile als Modul zum Lesen …

7 machine-learning python neural-network decision-trees k-nn