Nun, dies scheint der am besten geeignete Ort für diese Frage zu sein. Jede Website sammelt Daten des Benutzers, einige nur zur Benutzerfreundlichkeit und Personalisierung, aber die meisten wie soziale Netzwerke verfolgen jede Bewegung im Web, einige kostenlose Apps auf Ihrem Telefon scannen Textnachrichten, den Anrufverlauf und so weiter. All …
Ich habe eine HTML-Zeichenfolge und möchte herausfinden, ob ein von mir angegebenes Wort in dieser Zeichenfolge relevant ist. Die Relevanz könnte anhand der Häufigkeit im Text gemessen werden. Ein Beispiel zur Veranschaulichung meines Problems: this is an awesome bike store bikes can be purchased online. the bikes we own rock. …
Dies sind 4 verschiedene Gewichtsmatrizen, die ich nach dem Training einer eingeschränkten Boltzman-Maschine (RBM) mit ~ 4k sichtbaren Einheiten und nur 96 versteckten Einheiten / Gewichtsvektoren erhalten habe. Wie Sie sehen können, sind die Gewichte sehr ähnlich - sogar schwarze Pixel im Gesicht werden reproduziert. Die anderen 92 Vektoren sind …
Ich stellte eine ähnliche Frage nach der Entfernung zwischen "Dokumenten" (Wikipedia-Artikel, Nachrichten usw.). Ich habe dies zu einer separaten Frage gemacht, da Suchanfragen erheblich kleiner als Dokumente und erheblich lauter sind. Ich weiß daher nicht (und bezweifle), ob hier die gleichen Entfernungsmetriken verwendet werden würden. Entweder werden lexikalische Vanille-Distanzmetriken oder …
Kennt jemand einige gute Tutorials zu Online-Techniken des maschinellen Lernens? Dh wie es in Echtzeitumgebungen verwendet werden kann, was sind die Hauptunterschiede zu normalen Methoden des maschinellen Lernens usw. UPD: Vielen Dank an alle für die Antworten. Mit "online" meine ich Methoden, die in einem Echtzeitmodus trainiert werden können, basierend …
Ich habe eine Menge Dokumente, die eine Menge Schlüsselwertpaare enthalten. Der Schlüssel ist möglicherweise nicht eindeutig, sodass möglicherweise mehrere Schlüssel desselben Typs mit unterschiedlichen Werten vorhanden sind. Ich möchte die Ähnlichkeit der Schlüssel zwischen 2 Dokumenten vergleichen. Insbesondere die String-Ähnlichkeit dieser Werte. Ich denke darüber nach, so etwas wie den …
Ich entwickle ein System, das den "Kontext" der Benutzeraktivität innerhalb einer Anwendung erfassen soll. Es ist ein Framework, mit dem Webanwendungen Benutzeraktivitäten basierend auf Anforderungen an das System kennzeichnen können. Es ist zu hoffen, dass diese Daten dann ML-Funktionen wie das Abrufen kontextsensitiver Informationen unterstützen können. Ich habe Probleme bei …
Ich habe einen linear ansteigenden Zeitreihendatensatz eines Sensors mit Wertebereichen zwischen 50 und 150. Ich habe einen einfachen linearen Regressionsalgorithmus implementiert , um eine Regressionslinie an solche Daten anzupassen, und ich sage das Datum voraus, an dem die Reihe erreicht werden würde 120. Alles funktioniert gut, wenn sich die Serie …
Der beliebteste Anwendungsfall scheinen Empfehlungssysteme verschiedener Art zu sein (z. B. Empfehlungen für Einkaufsartikel, Benutzer in sozialen Netzwerken usw.). Aber was sind andere typische datenwissenschaftliche Anwendungen, die in anderen Branchen verwendet werden können? Zum Beispiel: Vorhersage der Kundenabwanderung mit maschinellem Lernen, Bewertung des Kundenlebensdauerwerts, Umsatzprognose.
Ich möchte die Genauigkeit einer Methodik testen. Ich habe es ~ 400 Mal ausgeführt und für jeden Lauf eine andere Klassifizierung erhalten. Ich habe auch die Grundwahrheit, dh die wirkliche Klassifikation, gegen die ich testen kann. Für jede Klassifikation habe ich eine Verwirrungsmatrix berechnet. Jetzt möchte ich diese Ergebnisse aggregieren, …
Einer der Gründe für die gemeinsame Verwendung von Storm- und Hadoop-Clustern in Summingbird ist, dass die Verarbeitung durch Storm zu einer Kaskadierung von Fehlern führt. Um diese Kaskadierung von Fehlern und deren Anhäufung zu vermeiden, wird der Hadoop-Cluster verwendet, um die Daten stapelweise zu verarbeiten und die Storm-Ergebnisse zu verwerfen, …
Kann mir jemand erklären, wie man Daten wie MNIST mit MLBP-Neural Network klassifiziert, wenn ich mehr als eine Ausgabe mache (zB 8)? Ich meine, wenn ich nur eine Ausgabe verwende, kann ich die Daten leicht klassifizieren, aber wenn ich mehr als verwende eine, welche Ausgabe soll ich wählen?
Mein Datensatz enthält insgesamt 200 Spalten, wobei jede Spalte in allen meinen Bildern demselben Pixel entspricht. Insgesamt habe ich 48.500 Zeilen. Die Beschriftungen für die Daten reichen von 0 bis 9. Die Daten sehen ungefähr so aus: raw_0 raw_1 raw_2 raw_3 raw_4 0 120.0 133.0 96.0 155.0 66.0 1 159.0 …
Ich habe eine XMatrix, eine yVariable und eine andere Variable ORTHO_VAR. Ich muss die yVariable vorhersagen , wobei Xdie Vorhersagen aus diesem Modell orthogonal sein müssen, ORTHO_VARwährend sie so korreliert ywie möglich sind. Ich würde es vorziehen, wenn die Vorhersagen mit einer nicht parametrischen Methode wie erzeugt werden, xgboost.XGBRegressoraber ich …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.