Data Science

Fragen und Antworten für Data Science-Experten, Machine Learning-Spezialisten und alle, die mehr über das Feld erfahren möchten

3
Warum verwendet die Logistikfunktion e anstelle von 2?
Die Sigmoidfunktion könnte als Aktivierungsfunktion beim maschinellen Lernen verwendet werden. S(x)=11+e−x=exex+1.S(x)=11+e−x=exex+1.{\displaystyle S(x)={\frac {1}{1+e^{-x}}}={\frac {e^{x}}{e^{x}+1}}.} Wenn e durch 2 ersetzt wird, def sigmoid2(z): return 1/(1+2**(-z)) x = np.arange(-9,9,dtype=float) y = sigmoid2(x) plt.scatter(x,y) Die Handlung sieht ähnlich aus. Warum wird die Logistikfunktion verwendet? eee eher als 2?



3
Finden Sie heraus, ob die beiden Datensätze nahe beieinander liegen
Ich habe die folgenden drei Datensätze. data_a=[0.21,0.24,0.36,0.56,0.67,0.72,0.74,0.83,0.84,0.87,0.91,0.94,0.97] data_b=[0.13,0.21,0.27,0.34,0.36,0.45,0.49,0.65,0.66,0.90] data_c=[0.14,0.18,0.19,0.33,0.45,0.47,0.55,0.75,0.78,0.82] data_a sind reale Daten und die anderen beiden sind die simulierten. Hier versuche ich zu überprüfen, welches (data_b oder data_c) dem data_a am nächsten kommt oder ihm sehr ähnlich ist. Derzeit mache ich es visuell und mit ks_2samp Test (Python). Visuell …

3
Docker für Data Science
Ich habe kürzlich angefangen, Artikel über Docker zu lesen. In der Datenwissenschaft ist Docker für mich nützlich, weil: 1) Sie haben eine völlig andere Umgebung, die Sie vor Problemen mit Bibliotheken und Abhängigkeiten schützt. 2) Wenn Ihre Anwendung beispielsweise die Datenbank Ihres Unternehmens ändert, möchten Sie zunächst sicherstellen, dass der …
7 data 

1
Ist es in Ordnung zu versuchen, den besten PCA k-Parameter zu finden, wie wir es mit anderen Hyperparametern tun?
Die Hauptkomponentenanalyse (PCA) wird verwendet, um n-dimensionale Daten auf k-dimensionale Daten zu reduzieren, um das maschinelle Lernen zu beschleunigen. Nachdem PCA angewendet wurde, kann überprüft werden, wie viel von der Varianz des ursprünglichen Datensatzes im resultierenden Datensatz verbleibt. Ein gemeinsames Ziel ist es, die Varianz zwischen 90% und 99% zu …

2
Was sind die Nachteile einer linksgerichteten Verteilung?
Ich arbeite derzeit an einem Klassifizierungsproblem und habe eine numerische Spalte, die schief bleibt. Ich habe viele Beiträge gelesen, in denen Leute empfehlen, eine Protokolltransformation oder eine Boxcox-Transformation durchzuführen, um die linke Schiefe zu beheben. Also habe ich mich gefragt, was passieren würde, wenn ich die Schiefe so belassen würde, …

4
Kann das Problem des verschwindenden Gradienten gelöst werden, indem die Eingabe von tanh mit einem Koeffizienten multipliziert wird?
Nach meinem Verständnis tritt das Problem des verschwindenden Gradienten beim Training neuronaler Netze auf, wenn der Gradient jeder Aktivierungsfunktion kleiner als 1 ist, so dass das Produkt dieser Gradienten sehr klein wird, wenn Korrekturen durch viele Schichten zurückpropagiert werden. Ich weiß, dass es andere Lösungen wie eine Gleichrichteraktivierungsfunktion gibt , …

1
Gibt es bereits tatsächliche kommerzielle Verwendungen von GANs?
Als ich im Internet recherchierte, fand ich viele wissenschaftliche Arbeiten, Ideen und Experimente zu GANs. Aber ich konnte kein einziges Beispiel dafür finden, dass es bereits kommerziell genutzt wird. Können Sie im ersten Quartal Beispiele für Unternehmen nennen, die bereits GANs in ihrem Produkt verwenden? F2 Wenn Sie keine Beispiele …
7 gan 

2
Validierung vs. Test vs. Trainingsgenauigkeit. Welches sollte ich vergleichen, um Überanpassung zu beanspruchen?
Ich habe in den verschiedenen Antworten hier und im Internet gelesen, dass eine Kreuzvalidierung hilfreich ist, um anzuzeigen, ob sich das Modell gut verallgemeinern lässt oder nicht und ob es zu einer Überanpassung kommt. Aber ich bin verwirrt darüber, welche zwei Genauigkeiten / Fehler unter Test / Training / Validierung …

1
Auf einem mehrsprachigen Stimmungskorpus
Ich möchte einen Stimmungskorpus für Nachrichtenartikel in mehreren Sprachen (~ 100.000 pro Sprache für ein Experiment zum maschinellen Lernen) zusammenstellen, in dem jeder Artikel als positiv, neutral oder negativ gekennzeichnet ist. Ich habe hoch und niedrig gesucht, konnte aber so etwas nicht finden. Ich habe bereits die Nachrichtenartikel in jeder …

5
Wann Mittelwert gegen Median zu verwenden ist
Ich bin neu in Data Science und Statistiken, daher scheint dies eine Anfängerfrage zu sein. Ich arbeite an einem Datensatz, bei dem die Twitter-Follower des Benutzers pro Tag zunehmen. Ich möchte das durchschnittliche Wachstum messen, das er über einen bestimmten Zeitraum hatte, indem ich den Mittelwert des Wachstums ermittelt habe. …


1
Wie kann ich nachweisen, dass die Engpassschicht meines CNN-Auto-Encoders nützliche Informationen enthält?
Ich verwende den CNN-Autoencoder, um eine Zustandsrepräsentationsschicht zu erstellen, die ich später in meinen Verstärkungsagenten einspeisen werde. Also habe ich meinen CNN-Autoencoder trainiert und er gibt nette Zustandsdarstellungen. Aber ich habe folgende Fragen: Kann meine Autoencoder-Schicht überpasst werden? Wenn es eine Überanpassung gibt, führt dies zu Abfallinformationen in meiner Engpassschicht?

1
Wie kann die Form der Eingabe-Features festgelegt werden, wenn jede Datendatei unterschiedlich lang ist?
Um Hilfe zu verstehen mich die Vorteile und Nachteile der decision trees, KNN, Neural Networks, Ich wollte einen einfachen Klassifizierer , dass stuft in 2 Klassen (bauen Bird Soundund Non-Bird Sound) mit allen oben 3 Methoden. Also habe ich einen Sound-Datensatz von kaggle heruntergeladen und pysoundfile als Modul zum Lesen …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.