t-SNE reduziert wie in [1] schrittweise die Kullback-Leibler (KL) -Divergenz, bis eine bestimmte Bedingung erfüllt ist. Die Entwickler von t-SNE schlagen vor, die KL-Divergenz als Leistungskriterium für die Visualisierungen zu verwenden: Sie können die von t-SNE gemeldeten Kullback-Leibler-Divergenzen vergleichen. Es ist vollkommen in Ordnung, t-SNE zehnmal auszuführen und die Lösung …
Ich möchte die Bytes von einem Disk-Image zeichnen, um ein Muster in ihnen zu verstehen. Dies ist hauptsächlich eine akademische Aufgabe, da ich fast sicher bin, dass dieses Muster von einem Festplattentestprogramm erstellt wurde, aber ich würde es trotzdem gerne rückentwickeln. Ich weiß bereits, dass das Muster mit einer Periodizität …
An meiner Universität haben wir einen HPC-Computercluster. Ich benutze den Cluster, um Klassifikatoren zu trainieren und so weiter. Um einen Job an den Cluster zu senden (z. B. Python-Scikit-Lernskript), muss ich normalerweise ein Bash-Skript schreiben, das (unter anderem) einen Befehl wie enthält qsub script.py. Ich finde diesen Prozess jedoch sehr, …
Es gibt viele Quellen, die die historischen Bestandsdaten liefern, aber sie liefern nur die OHLC-Felder zusammen mit dem Volumen und dem angepassten Abschluss. Einige Quellen, die ich gefunden habe, bieten auch Marktkapitalisierungsdatensätze, die jedoch auf US-Aktien beschränkt sind. Yahoo Finance stellt diese Daten online zur Verfügung, es gibt jedoch keine …
Die übliche Definition von Regression (soweit mir bekannt ist) ist die Vorhersage einer kontinuierlichen Ausgabevariablen aus einem bestimmten Satz von Eingabevariablen . Die logistische Regression ist ein binärer Klassifizierungsalgorithmus, der eine kategoriale Ausgabe erzeugt. Ist es wirklich ein Regressionsalgorithmus? Wenn ja warum?
Ich bin neugierig auf Fragen in natürlicher Sprache. Stanford verfügt über eine anscheinend starke Software zur Verarbeitung natürlicher Sprache . Ich habe auch die Apache OpenNLP-Bibliothek und die Allgemeine Architektur für Text Engineering gesehen . Es gibt unglaublich viele Verwendungsmöglichkeiten für die Verarbeitung natürlicher Sprache, und das macht es schwierig, …
Ich möchte 'Data Science' erforschen. Der Begriff scheint mir ein wenig vage zu sein, aber ich erwarte, dass er Folgendes erfordert: maschinelles Lernen (anstelle traditioneller Statistiken); Ein Datensatz, der groß genug ist, um Analysen für Cluster auszuführen. Was sind einige gute Datensätze und Probleme, auf die ein Statistiker mit Programmierhintergrund …
In den meisten Schätzern für Scikit-Learn gibt es n_jobsin fit/ predictMethoden einen Parameter zum Erstellen paralleler Jobs mit joblib. Ich habe festgestellt, dass durch das Festlegen von -1nur 1 Python-Prozess die Kerne maximal genutzt werden und die CPU-Auslastung 2500% übersteigt. Dies unterscheidet sich erheblich von der Einstellung auf eine positive …
Ich bin sehr neu in Deep Learning und ich bin besonders daran interessiert zu wissen, was LSTM und BiLSTM sind und wann ich sie verwenden soll (Hauptanwendungsbereiche). Warum sind LSTM und BILSTM beliebter als RNN? Können wir diese Deep-Learning-Architekturen bei unbeaufsichtigten Problemen verwenden?
Ich versuche, ein einzelnes Perzeptron (1000 Eingabeeinheiten, 1 Ausgabe, keine versteckten Ebenen) auf 64 zufällig generierten Datenpunkten zu trainieren. Ich verwende Pytorch mit dem Adam-Optimierer: import torch from torch.autograd import Variable torch.manual_seed(545345) N, D_in, D_out = 64, 1000, 1 x = Variable(torch.randn(N, D_in)) y = Variable(torch.randn(N, D_out)) model = torch.nn.Linear(D_in, …
Ich bin etwas verwirrt über den Unterschied zwischen den Begriffen "Maschinelles Lernen" und "Deep Learning". Ich habe es gegoogelt und viele Artikel gelesen, aber es ist mir immer noch nicht sehr klar. Eine bekannte Definition von maschinellem Lernen von Tom Mitchell ist: Ein Computerprogramm soll aus der Erfahrung E in …
Die Genauigkeit ist der Bruchteil der abgerufenen Instanzen, die relevant sind, während der Rückruf (auch als Empfindlichkeit bezeichnet) der Bruchteil der relevanten Instanzen ist, die abgerufen werden. Ich kenne ihre Bedeutung, aber ich weiß nicht, warum es Rückruf heißt ? Ich bin kein englischer Muttersprachler. Ich weiß, dass Rückruf bedeutet, …
In der folgenden Grafik x-Achse => Datensatzgröße y-Achse => Kreuzvalidierungsergebnis Die rote Linie steht für Trainingsdaten Die grüne Linie dient zum Testen von Daten In einem Tutorial, auf das ich mich beziehe, sagt der Autor, dass der Punkt, an dem sich die rote und die grüne Linie überlappen, bedeutet: Es …
Was passiert, wenn wir eine grundlegende Support-Vektor-Maschine (linearer Kernel und kein Soft-Margin) auf nicht linear trennbaren Daten trainieren? Das Optimierungsproblem ist nicht realisierbar. Was gibt der Minimierungsalgorithmus zurück?
Wie ändert das Variieren des Regularisierungsparameters in einer SVM die Entscheidungsgrenze für einen nicht trennbaren Datensatz? Eine visuelle Antwort und / oder ein Kommentar zu den einschränkenden Verhaltensweisen (für große und kleine Regularisierung) wäre sehr hilfreich.
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.