Statistiken und Big Data machine-learning

1

Kann ein Modell von P (Y | X) durch stochastischen Gradientenabstieg von nicht-iid-Proben von P (X) und iid-Proben von P (Y | X) trainiert werden?

Beim Trainieren eines parametrisierten Modells (z. B. zur Maximierung der Wahrscheinlichkeit) über einen stochastischen Gradientenabstieg in einem Datensatz wird üblicherweise angenommen, dass die Trainingsmuster aus der Trainingsdatenverteilung entnommen werden. Wenn das Ziel darin besteht, eine gemeinsame Verteilung zu modellieren , sollte jede Trainingsprobe aus dieser Verteilung gezogen werden.P(X,Y)P(X,Y)P(X,Y)(xi,yi)(xi,yi)(x_i,y_i) Wenn das …

10 machine-learning conditional-probability reinforcement-learning gradient-descent

3

Was ist die effizienteste Methode zum Trainieren von Daten mit dem geringsten Speicher?

Dies sind meine Trainingsdaten: 200.000 Beispiele x 10.000 Funktionen. Meine Trainingsdatenmatrix ist also - 200.000 x 10.000. Ich habe es geschafft, dies in einer flachen Datei ohne Speicherprobleme zu speichern, indem ich jeden Datensatz einzeln (ein Beispiel nach dem anderen) gespeichert habe, während ich die Funktionen für jedes Beispiel generierte. …

10 machine-learning dataset algorithms python

2

Regularisierung Norm und Norm empirische Studie

Es gibt viele Methoden zur Durchführung der Regularisierung - beispielsweise die Regularisierung , und . Laut Friedman Hastie & Tibsharani hängt der beste Regularisierer vom Problem ab: nämlich der Art der tatsächlichen Zielfunktion, der jeweils verwendeten Basis, dem Signal-Rausch-Verhältnis und der Stichprobengröße.L 1 L 2L0L0L_0L1L1L_1L2L2L_2 Gibt es empirische Untersuchungen zum …

10 r regression machine-learning regularization

3

Vergleich der Genauigkeit zweier verschiedener Modelle anhand der statistischen Signifikanz

Ich arbeite an der Vorhersage von Zeitreihen. Ich habe zwei Datensätze und . Ich habe drei Vorhersagemodelle: . Alle diese Modelle werden unter Verwendung von Stichproben in Datensatz trainiert , und ihre Leistung wird unter Verwendung der Stichproben in Datensatz gemessen . Angenommen, die Leistungsmetrik ist MSE (oder etwas anderes). …

10 time-series machine-learning statistical-significance classification model-evaluation

3

In Bezug auf die Verwendung des Bigram-Modells (N-Gramm) zum Erstellen eines Merkmalsvektors für ein Textdokument

Ein traditioneller Ansatz der Feature-Konstruktion für das Text-Mining ist der Bag-of-Word-Ansatz und kann mithilfe von tf-idf zum Einrichten des Feature-Vektors, der ein bestimmtes Textdokument charakterisiert, erweitert werden. Gegenwärtig versuche ich, ein Bi-Gramm-Sprachmodell oder (N-Gramm) zum Erstellen eines Merkmalsvektors zu verwenden, weiß aber nicht genau, wie das geht? Können wir einfach …

10 machine-learning data-mining text-mining natural-language language-models

1

Jenseits der Fischerkerne

Für eine Weile schien es, als ob Fisher Kernels populär werden könnten, da sie eine Möglichkeit zu sein schienen, Kernel aus probabilistischen Modellen zu konstruieren. Ich habe sie jedoch selten in der Praxis gesehen, und ich bin der festen Überzeugung, dass sie in der Regel nicht sehr gut funktionieren. Sie …

10 machine-learning probability kernel-trick generative-models

1

Umgang mit sehr großen Zeitreihendatensätzen

Ich habe Zugriff auf einen sehr großen Datensatz. Die Daten stammen aus MEG- Aufnahmen von Personen, die Musikausschnitte aus einem von vier Genres hören. Die Daten sind wie folgt: 6 Themen 3 Experimentelle Wiederholungen (Epochen) 120 Prüfungen pro Epoche 8 Sekunden Daten pro Versuch bei 500 Hz (= 4000 Abtastungen) …

10 machine-learning feature-selection large-data feature-construction

3

Ansätze beim Lernen aus riesigen Datensätzen?

Grundsätzlich gibt es zwei gängige Methoden, um gegen große Datenmengen zu lernen (wenn Sie mit zeitlichen / räumlichen Einschränkungen konfrontiert sind): Betrug :) - Verwenden Sie nur eine "überschaubare" Teilmenge für das Training. Der Genauigkeitsverlust kann aufgrund des Gesetzes zur Verringerung der Rendite vernachlässigbar sein - die Vorhersageleistung des Modells …

10 machine-learning large-data model-evaluation train

1

Sind MFCCs die optimale Methode zur Darstellung von Musik in einem Abrufsystem?

Eine Signalverarbeitungstechnik, die Mel-Frequenz Cepstrum , wird häufig verwendet, um Informationen aus einem Musikstück zur Verwendung in einer maschinellen Lernaufgabe zu extrahieren. Diese Methode liefert ein kurzfristiges Leistungsspektrum, und die Koeffizienten werden als Eingabe verwendet. Beim Entwerfen von Musikabrufsystemen werden solche Koeffizienten als charakteristisch für ein Stück angesehen (offensichtlich nicht …

10 machine-learning classification signal-processing mfcc

8

Welcher Algorithmus könnte verwendet werden, um den Verbrauch von Verbrauchsmaterialien anhand von Daten aus früheren Einkäufen vorherzusagen?

Wenn ich über ein vermeintlich einfaches, aber interessantes Problem nachdenke, möchte ich einen Code schreiben, um die Verbrauchsmaterialien vorherzusagen, die ich in naher Zukunft benötigen werde, angesichts der vollständigen Historie meiner vorherigen Einkäufe. Ich bin sicher, dass diese Art von Problem eine allgemeinere und besser untersuchte Definition hat (jemand schlug …

10 time-series machine-learning forecasting

6

Vergleichen Sie das R-Quadrat aus zwei verschiedenen Random Forest-Modellen

Ich verwende das randomForest-Paket in R, um ein zufälliges Waldmodell zu entwickeln und zu versuchen, ein kontinuierliches Ergebnis in einem "breiten" Datensatz mit mehr Prädiktoren als Stichproben zu erklären. Insbesondere passe ich ein RF-Modell an, mit dem das Verfahren aus einem Satz von ~ 75 Prädiktorvariablen auswählen kann, die ich …

10 r machine-learning hypothesis-testing model-selection random-forest

2

Gründe für die Verwendung von AUC?

Insbesondere auf der computerwissenschaftlich orientierten Seite der Literatur zum maschinellen Lernen ist die AUC (Fläche unter der Kennlinie des Empfängeroperators) ein beliebtes Kriterium für die Bewertung von Klassifikatoren. Was sind die Gründe für die Verwendung der AUC? Gibt es beispielsweise eine bestimmte Verlustfunktion, für die die optimale Entscheidung der Klassifikator …

10 machine-learning roc

1

Signifikanz von (GAM) Regressionskoeffizienten, wenn die Modellwahrscheinlichkeit nicht signifikant höher als Null ist

Ich führe eine GAM-basierte Regression mit dem R-Paket gamlss durch und gehe von einer Null- Inflations -Beta-Verteilung der Daten aus. Ich habe nur eine einzige erklärende Variable in meinem Modell, also ist es im Grunde : mymodel = gamlss(response ~ input, family=BEZI). Der Algorithmus gibt mir den Koeffizienten für den …

10 nonlinear-regression gamlss machine-learning svm

2

Beste Methoden zur Merkmalsauswahl für nichtparametrische Regression

Eine neue Frage hier. Ich führe derzeit eine nichtparametrische Regression mit dem np-Paket in R durch. Ich habe 7 Funktionen und mit einem Brute-Force-Ansatz habe ich die besten 3 identifiziert. Aber bald werde ich viel mehr als 7 Funktionen haben! Meine Frage ist, was die derzeit besten Methoden zur Merkmalsauswahl …

10 r machine-learning nonparametric feature-selection

1

Dokumentierte / reproduzierbare Beispiele für erfolgreiche reale Anwendungen ökonometrischer Methoden?

Diese Frage mag sehr weit gefasst klingen, aber hier ist, wonach ich suche. Ich weiß, dass es viele ausgezeichnete Bücher über ökonometrische Methoden und viele ausgezeichnete Expository-Artikel über ökonometrische Techniken gibt. Es gibt sogar ausgezeichnete reproduzierbare Beispiele für Ökonometrie, wie in dieser CrossValidated- Frage beschrieben . Tatsächlich kommen die Beispiele …

10 r machine-learning forecasting data-mining econometrics

Als «machine-learning» getaggte Fragen