Als «machine-learning» getaggte Fragen

Methoden und Prinzipien zum Aufbau von "Computersystemen, die sich mit der Erfahrung automatisch verbessern".

2
Wie erstelle ich eine Textsuchmaschine?
Ich habe eine HTML-Zeichenfolge und möchte herausfinden, ob ein von mir angegebenes Wort in dieser Zeichenfolge relevant ist. Die Relevanz könnte anhand der Häufigkeit im Text gemessen werden. Ein Beispiel zur Veranschaulichung meines Problems: this is an awesome bike store bikes can be purchased online. the bikes we own rock. …

2
Was sind einige Standardmethoden zur Berechnung der Entfernung zwischen einzelnen Suchanfragen?
Ich stellte eine ähnliche Frage nach der Entfernung zwischen "Dokumenten" (Wikipedia-Artikel, Nachrichten usw.). Ich habe dies zu einer separaten Frage gemacht, da Suchanfragen erheblich kleiner als Dokumente und erheblich lauter sind. Ich weiß daher nicht (und bezweifle), ob hier die gleichen Entfernungsmetriken verwendet werden würden. Entweder werden lexikalische Vanille-Distanzmetriken oder …

4
Online-Tutorial zum maschinellen Lernen
Kennt jemand einige gute Tutorials zu Online-Techniken des maschinellen Lernens? Dh wie es in Echtzeitumgebungen verwendet werden kann, was sind die Hauptunterschiede zu normalen Methoden des maschinellen Lernens usw. UPD: Vielen Dank an alle für die Antworten. Mit "online" meine ich Methoden, die in einem Echtzeitmodus trainiert werden können, basierend …

2
Linear ansteigende Daten durch manuelles Zurücksetzen
Ich habe einen linear ansteigenden Zeitreihendatensatz eines Sensors mit Wertebereichen zwischen 50 und 150. Ich habe einen einfachen linearen Regressionsalgorithmus implementiert , um eine Regressionslinie an solche Daten anzupassen, und ich sage das Datum voraus, an dem die Reihe erreicht werden würde 120. Alles funktioniert gut, wenn sich die Serie …


1
Generieren Sie Vorhersagen, die orthogonal (nicht korreliert) zu einer bestimmten Variablen sind
Ich habe eine XMatrix, eine yVariable und eine andere Variable ORTHO_VAR. Ich muss die yVariable vorhersagen , wobei Xdie Vorhersagen aus diesem Modell orthogonal sein müssen, ORTHO_VARwährend sie so korreliert ywie möglich sind. Ich würde es vorziehen, wenn die Vorhersagen mit einer nicht parametrischen Methode wie erzeugt werden, xgboost.XGBRegressoraber ich …
8 correlation  machine-learning  dataset  logistic-regression  prediction  linear-regression  prediction  dummy-variables  neural-network  image-classification  python  k-nn  python  neural-network  neural-network  deep-learning  keras  tensorflow  image-classification  tensorflow  reinforcement-learning  policy-gradients  machine-learning  decision-trees  neural-network  overfitting  data-analysis  metric  python  scikit-learn  distance  scipy  machine-learning  python  scikit-learn  decision-trees  logistic-regression  keras  image-classification  implementation  machine-learning  python  scikit-learn  random-forest  decision-trees  machine-learning  feature-selection  feature-engineering  word2vec  word-embeddings  natural-language-process  scikit-learn  time-series  clustering  k-means  python  cross-validation  pyspark  statistics  cross-validation  multiclass-classification  evaluation  machine-learning  nlp  machine-translation  neural-network  deep-learning  keras  tensorflow  image-classification  machine-learning  python  similarity  distance  lstm  text  named-entity-recognition  machine-learning  keras  optimization  gan  learning-rate  neural-network  data-mining  dataset  databases  books  neural-network  rnn 

2
Gibt es einen Konsens über die Wahl eines geeigneten ML-Ansatzes?
Ich studiere zurzeit Datenwissenschaft und wir lernen eine schwindelerregende Vielfalt grundlegender Regressions- / Klassifizierungstechniken (linear, logistisch, Bäume, Splines, ANN, SVM, MARS usw.) sowie eine Vielzahl von zusätzliche Werkzeuge (Bootstrapping, Boosten, Absacken, Ensemble, Ridge / Lasso, CV usw. usw.). Manchmal erhalten die Techniken einen Kontext (z. B. geeignet für kleine / …

1
Quelle von Arthur Samuels Definition des maschinellen Lernens
Viele Menschen scheinen zuzustimmen, dass Arthur Samuel 1959 schrieb oder sagte, dass maschinelles Lernen das " Studienfeld ist, in dem Computer lernen können, ohne explizit programmiert zu werden ". Zum Beispiel ist das Zitat in enthält dieser Seite , dass eine und Andrew Ng ML Kurs . Einige Artikel enthalten …



2
Wie funktioniert die allgemeine Vorteilsschätzung?
Ich habe schon seit einiger Zeit versucht, GAE zu meiner A2C-Implementierung hinzuzufügen , aber ich kann nicht ganz verstehen, wie es funktioniert. Mein Verständnis davon ist, dass es die Varianz der Vorteilsschätzungsfunktion reduziert, indem die Vorteile basierend auf den Werten im Rollout "gemittelt" (oder verallgemeinert) werden. Ich habe versucht, die …

3
Unterschied zwischen Indikatorspalte und kategorialer Identitätsspalte im Tensorflow
Ich lerne Tensorflow und bin auf verschiedene Feature-Spalten gestoßen, die in Tensorflow verwendet werden. Von diesen Typen sind zwei categorical_identity_columnund indicator_column. Beide wurden auf die gleiche Weise definiert. Soweit ich weiß, konvertieren beide kategoriale Spalten in One-Hot-codierte Spalten. Meine Frage ist also, was ist der Unterschied zwischen den beiden? Wann …


2
Bedeutung der XGBoost-Funktion - Verstärkung und Abdeckung sind hoch, aber die Frequenz ist niedrig
Ich habe diese Frage gelesen: Wie interpretiere ich die Ausgabe von XGBoost wichtig? Informationen zu den drei verschiedenen Arten von Feature-Wichtigkeiten: Häufigkeit (in Python XGBoost als "Gewicht" bezeichnet), Verstärkung und Deckung. In meinem Fall habe ich eine Funktion, Geschlecht, die basierend auf der Frequenzmetrik eine sehr geringe Bedeutung hat, aber …

2
Train / Test Split nach SMOTE durchführen
Ich habe es mit sehr unausgeglichenen Daten zu tun, daher habe ich den SMOTE-Algorithmus verwendet, um den Datensatz neu abzutasten. Nach dem SMOTE-Resampling habe ich den neu abgetasteten Datensatz in Trainings- / Testsätze aufgeteilt, wobei ich den Trainingssatz zum Erstellen eines Modells und den Testsatz zum Bewerten des Modells verwendet …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.