Statistiken und Big Data

3

Richtlinie zur Auswahl der Hyperparameter in Deep Learning

Ich bin auf der Suche nach einem Artikel, der dabei helfen kann, eine Richtlinie zur Auswahl der Hyperparameter einer Deep-Architecture wie gestapelte Auto-Encoder oder Deep-Believe-Netzwerke zu erstellen. Es gibt viele Hyperparameter und ich bin sehr verwirrt, wie ich sie auswählen soll. Auch die Kreuzvalidierung ist keine Option, da das Training …

38 machine-learning deep-learning deep-belief-networks hyperparameter

1

Wie werden beim Zentrieren der Daten die Unterbrechungen bei Regression und PCA beseitigt?

Ich lese immer wieder über Fälle, in denen wir die Daten zentrieren (z. B. mit Regularisierung oder PCA), um den Intercept zu entfernen (wie in dieser Frage erwähnt ). Ich weiß, dass es einfach ist, aber es fällt mir schwer, das intuitiv zu verstehen. Könnte jemand die Intuition oder eine …

38 regression pca centering

1

Was ist die Varianz der gewichteten Mischung aus zwei Gaußschen?

ich habe zwei Normalverteilungen A und B mit den Bedeutungen und und den Varianzen und . Ich möchte eine gewichtete Mischung dieser beiden Verteilungen mit den Gewichten und wobei und . Ich weiß, dass der Mittelwert dieser Mischung .μAμA\mu_AμBμB\mu_BσAσA\sigma_AσBσB\sigma_Bpppqqq0≤p≤10≤p≤10\le p \le 1q=1−pq=1−pq = 1-pμAB=(p×μA)+(q×μB)μAB=(p×μA)+(q×μB)\mu_{AB} = (p\times\mu_A) + (q\times\mu_B) Was wäre …

38 normal-distribution mixture

1

Manuell berechnetes stimmt nicht mit randomForest () überein, um neue Daten zu testen

Ich weiß, dass dies eine ziemlich spezifische RFrage ist, aber ich denke möglicherweise falsch über die erklärte Proportionsvarianz . Hier geht.R2R2R^2 Ich versuche das RPaket zu benutzen randomForest. Ich habe einige Trainingsdaten und Testdaten. Wenn ich ein zufälliges Gesamtstrukturmodell anpasse, randomForestkönnen Sie mit dieser Funktion neue Testdaten zum Testen eingeben. …

38 r correlation predictive-models random-forest r-squared

3

Online oder Offline lernen?

Was ist der Unterschied zwischen Offline- und Online-Lernen ? Geht es nur darum, über den gesamten Datensatz (offline) zu lernen oder inkrementell (jeweils eine Instanz) zu lernen? Was sind Beispiele für Algorithmen, die in beiden verwendet werden?

38 machine-learning online

3

Wenden Sie Worteinbettungen auf das gesamte Dokument an, um einen Feature-Vektor zu erhalten

Wie verwende ich eine Worteinbettung, um ein Dokument einem Feature-Vektor zuzuordnen, der für die Verwendung mit überwachtem Lernen geeignet ist? Ein Wort Einbettungs bildet jedes Wort auf einen Vektor v ∈ R d , wobei d einige nicht allzu große Anzahl (zB 500). Beliebte Wort Einbettungen sind word2vec und Handschuh …

38 classification natural-language supervised-learning word2vec word-embeddings

2

A / B-Tests: Z-Test vs. T-Test vs. Chi-Quadrat vs. Fisher-Exakter Test

Ich versuche, die Argumentation zu verstehen, indem ich bei einem einfachen A / B-Test einen bestimmten Testansatz wähle (dh zwei Variationen / Gruppen mit einer binären Antwort (konvertiert oder nicht)). Als Beispiel verwende ich die folgenden Daten Version Visits Conversions A 2069 188 B 1826 220 Die beste Antwort hier …

38 statistical-significance chi-squared p-value fishers-exact z-statistic

1

PCA- und Korrespondenzanalyse in Bezug auf Biplot

Biplot wird häufig verwendet, um Ergebnisse der Hauptkomponentenanalyse (und verwandter Techniken) anzuzeigen . Es ist eine Dual oder Overlay Streukomponente zeigt Belastungen und Komponenten Partituren gleichzeitig. Ich wurde heute von @amoeba darüber informiert, dass er abweichend von meinem Kommentar eine Antwort auf eine Frage gegeben hat, in der gefragt wird, …

38 pca multivariate-analysis svd correspondence-analysis biplot

2

Interpretation der Ausgabe von R für die binomiale Regression

Ich bin ziemlich neu in diesem Bereich mit Binomialdatentests, musste aber einen durchführen, und jetzt bin ich nicht sicher, wie ich das Ergebnis interpretieren soll. Die y-Variable, die Antwortvariable, ist binomisch und die erklärenden Faktoren sind stetig. Folgendes habe ich bei der Zusammenfassung des Ergebnisses erhalten: glm(formula = leaves.presence ~ …

38 r regression logistic binomial interpretation

1

Sollte ich die Wortvektoren von word2vec normalisieren, bevor ich sie verwende?

Ist es nach dem Training von Wortvektoren mit word2vec besser, sie zu normalisieren, bevor Sie sie für einige nachgelagerte Anwendungen verwenden? Dh was sind die Vor- / Nachteile einer Normalisierung?

38 natural-language word2vec word-embeddings

8

Wann sollte eine Variable in eine Regression einbezogen werden, obwohl sie statistisch nicht signifikant ist?

Ich bin ein Wirtschaftsstudent mit etwas Erfahrung in Ökonometrie und R. Ich würde gerne wissen, ob es jemals eine Situation gibt, in der wir eine Variable in eine Regression einbeziehen sollten, obwohl sie statistisch nicht signifikant ist.

37 statistical-significance feature-selection

3

Varianz der

TL, DR: Es sieht so aus, als ob entgegen häufig wiederholter Ratschläge die einmalige Kreuzvalidierung (LOO-CV) - das heißt, derKKK fache CV mitKKK (die Anzahl der Falten) ist gleichNNN (die Anzahl) der Trainingsbeobachtungen) - liefert Schätzungen des Generalisierungsfehlers, diefür jedes K am wenigsten variabel sind, und nicht die variabelsten, wobei …

37 regression machine-learning variance cross-validation predictive-models

5

Wird die Tatsache, dass mein italienischer Sohn eine Grundschule besuchen wird, die erwartete Anzahl italienischer Kinder ändern, die in seiner Klasse anwesend sein werden?

Dies ist eine Frage, die aus einer realen Situation stammt, für die ich ernsthaft über ihre Antwort verblüfft bin. Mein Sohn soll in London in die Grundschule gehen. Da wir Italiener sind, war ich gespannt, wie viele italienische Kinder bereits die Schule besuchen. Ich habe dies der Zulassungsbehörde bei der …

37 probability self-study average

2

Ist es ungewöhnlich, dass die MEAN ARIMA übertrifft?

Ich habe kürzlich eine Reihe von Prognosemethoden (MEAN, RWF, ETS, ARIMA und MLPs) angewendet und festgestellt, dass MEAN überraschend gut abschneidet. (BEDEUTUNG: Alle zukünftigen Vorhersagen werden als gleich dem arithmetischen Mittel der beobachteten Werte vorausgesagt.) BEDEUTUNG übertraf ARIMA bei den drei von mir verwendeten Serien sogar. Ich möchte wissen, ob …

37 forecasting arima

1

Warum erreicht glmer nicht die maximale Wahrscheinlichkeit (wie durch weitere generische Optimierung überprüft)?

Numerisch die Ableitung MLE s von GLMM schwierig ist und in der Praxis, ich weiß, wir sollten nicht Brute - Force - Optimierung verwenden (zB mit optimauf einfache Art und Weise). Aus pädagogischen Gründen möchte ich es jedoch versuchen, um sicherzustellen, dass ich das Modell richtig verstehe (siehe folgenden Code). …

37 r maximum-likelihood optimization lme4-nlme