Als «machine-learning» getaggte Fragen

Methoden und Prinzipien zum Aufbau von "Computersystemen, die sich mit der Erfahrung automatisch verbessern".

4
Mustererkennung am Finanzmarkt
Welches Modell für maschinelles Lernen oder tiefes Lernen ( muss überwachtes Lernen sein ) eignet sich am besten zum Erkennen von Mustern auf den Finanzmärkten? Was ich unter Mustererkennung auf dem Finanzmarkt verstehe: Das folgende Bild zeigt, wie ein Beispielmuster (dh Kopf und Schulter) aussieht: Bild 1: Das folgende Bild …


1
Wie berechnen Sie, wie dicht oder dünn ein Datensatz ist?
Ich beschäftige mich eingehender mit der kollaborativen Filterung. Ein wirklich interessantes Papier ist "Eine vergleichende Studie über kollaborative Filteralgorithmen" http://arxiv.org/pdf/1205.3193.pdf Um auszuwählen, welcher CF-Algorithmus verwendet werden soll, bezieht sich das Papier auf die Dichte des Datensatzes. Es wird nicht erklärt, wie Sie die Dichte Ihres Datensatzes tatsächlich berechnen. Kann mir …


4
Ähnlichkeit der Berufsbezeichnung
Ich versuche, eine Metrik zwischen Berufsbezeichnungen im IT-Bereich zu definieren. Dazu benötige ich eine Metrik zwischen Wörtern von Berufsbezeichnungen, die nicht zusammen in derselben Berufsbezeichnung erscheinen, z. B. eine Metrik zwischen den Wörtern Senior, Primary, Lead, Head, VP, Director, Zeug, Principal, Chief, oder die Wörter Analyst, Experte, Modellierer, Forscher, Wissenschaftler, …

1
Frage zum Bias-Varianz-Kompromiss und zu Optimierungsmitteln
Ich habe mich also gefragt, wie man zum Beispiel das Modell, das sie zu erstellen versuchen, am besten optimieren kann, wenn man mit Problemen konfrontiert wird, die durch hohe Voreingenommenheit oder hohe Varianz verursacht werden. Jetzt können Sie natürlich mit dem Regularisierungsparameter spielen, um ein zufriedenstellendes Ende zu erreichen, aber …

3
Warum verwendet die Logistikfunktion e anstelle von 2?
Die Sigmoidfunktion könnte als Aktivierungsfunktion beim maschinellen Lernen verwendet werden. S(x)=11+e−x=exex+1.S(x)=11+e−x=exex+1.{\displaystyle S(x)={\frac {1}{1+e^{-x}}}={\frac {e^{x}}{e^{x}+1}}.} Wenn e durch 2 ersetzt wird, def sigmoid2(z): return 1/(1+2**(-z)) x = np.arange(-9,9,dtype=float) y = sigmoid2(x) plt.scatter(x,y) Die Handlung sieht ähnlich aus. Warum wird die Logistikfunktion verwendet? eee eher als 2?

1
Ist es in Ordnung zu versuchen, den besten PCA k-Parameter zu finden, wie wir es mit anderen Hyperparametern tun?
Die Hauptkomponentenanalyse (PCA) wird verwendet, um n-dimensionale Daten auf k-dimensionale Daten zu reduzieren, um das maschinelle Lernen zu beschleunigen. Nachdem PCA angewendet wurde, kann überprüft werden, wie viel von der Varianz des ursprünglichen Datensatzes im resultierenden Datensatz verbleibt. Ein gemeinsames Ziel ist es, die Varianz zwischen 90% und 99% zu …

2
Was sind die Nachteile einer linksgerichteten Verteilung?
Ich arbeite derzeit an einem Klassifizierungsproblem und habe eine numerische Spalte, die schief bleibt. Ich habe viele Beiträge gelesen, in denen Leute empfehlen, eine Protokolltransformation oder eine Boxcox-Transformation durchzuführen, um die linke Schiefe zu beheben. Also habe ich mich gefragt, was passieren würde, wenn ich die Schiefe so belassen würde, …

4
Kann das Problem des verschwindenden Gradienten gelöst werden, indem die Eingabe von tanh mit einem Koeffizienten multipliziert wird?
Nach meinem Verständnis tritt das Problem des verschwindenden Gradienten beim Training neuronaler Netze auf, wenn der Gradient jeder Aktivierungsfunktion kleiner als 1 ist, so dass das Produkt dieser Gradienten sehr klein wird, wenn Korrekturen durch viele Schichten zurückpropagiert werden. Ich weiß, dass es andere Lösungen wie eine Gleichrichteraktivierungsfunktion gibt , …

2
Validierung vs. Test vs. Trainingsgenauigkeit. Welches sollte ich vergleichen, um Überanpassung zu beanspruchen?
Ich habe in den verschiedenen Antworten hier und im Internet gelesen, dass eine Kreuzvalidierung hilfreich ist, um anzuzeigen, ob sich das Modell gut verallgemeinern lässt oder nicht und ob es zu einer Überanpassung kommt. Aber ich bin verwirrt darüber, welche zwei Genauigkeiten / Fehler unter Test / Training / Validierung …

1
Auf einem mehrsprachigen Stimmungskorpus
Ich möchte einen Stimmungskorpus für Nachrichtenartikel in mehreren Sprachen (~ 100.000 pro Sprache für ein Experiment zum maschinellen Lernen) zusammenstellen, in dem jeder Artikel als positiv, neutral oder negativ gekennzeichnet ist. Ich habe hoch und niedrig gesucht, konnte aber so etwas nicht finden. Ich habe bereits die Nachrichtenartikel in jeder …

1
Wie kann die Form der Eingabe-Features festgelegt werden, wenn jede Datendatei unterschiedlich lang ist?
Um Hilfe zu verstehen mich die Vorteile und Nachteile der decision trees, KNN, Neural Networks, Ich wollte einen einfachen Klassifizierer , dass stuft in 2 Klassen (bauen Bird Soundund Non-Bird Sound) mit allen oben 3 Methoden. Also habe ich einen Sound-Datensatz von kaggle heruntergeladen und pysoundfile als Modul zum Lesen …

2
Neuronale Netzwerkarchitektur zum Identifizieren von Bildkopien
Ich habe eine große Bildersammlung und möchte die Bilder in dieser Sammlung identifizieren, die andere Bilder aus der Sammlung zu kopieren scheinen. Um Ihnen einen Eindruck von den Arten von Bildpaaren zu geben, die ich als Übereinstimmungen klassifizieren möchte, betrachten Sie bitte diese Beispiele: Ich habe ungefähr 0,25 Millionen Paare …

1
Was sind einige Situationen, in denen die Normalisierung der Eingabedaten auf Null bedeutet, dass die Einheitsvarianz nicht angemessen oder nicht vorteilhaft ist?
Ich habe beim maschinellen Lernen viele Male eine Normalisierung der Eingabedaten auf den Mittelwert Null und die Einheitsvarianz gesehen. Ist dies eine gute Praxis, die ständig durchgeführt werden muss, oder gibt es Zeiten, in denen dies nicht angemessen oder nicht vorteilhaft ist?

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.