Statistiken und Big Data

1

Unterschied zwischen GradientDescentOptimizer und AdamOptimizer (TensorFlow)?

Ich habe ein einfaches MLP in TensorFlow geschrieben, das ein XOR-Gate modelliert . So für: input_data = [[0., 0.], [0., 1.], [1., 0.], [1., 1.]] es sollte folgendes erzeugen: output_data = [[0.], [1.], [1.], [0.]] Das Netzwerk hat eine Eingangsschicht, eine versteckte Schicht und eine Ausgangsschicht mit jeweils 2, 5 …

45 machine-learning neural-networks error gradient-descent supervised-learning

6

Was sind die Hauptsätze beim maschinellen (Tiefen-) Lernen?

Al Rahimi hat kürzlich in NIPS 2017 einen sehr provokanten Vortrag gehalten, in dem er das aktuelle maschinelle Lernen mit Alchemie vergleicht. Eine seiner Behauptungen ist, dass wir zu theoretischen Entwicklungen zurückkehren müssen, um einfache Theoreme zu haben, die grundlegende Ergebnisse beweisen. Als er das sagte, fing ich an, nach …

45 machine-learning deep-learning theory

1

Wie kann man bestimmen, ob die y-Achse eines Graphen bei Null beginnen soll oder nicht?

Eine gebräuchliche Methode, um "mit Daten zu lügen", ist die Verwendung einer Y-Achsen-Skala, die den Anschein erweckt, als wären Änderungen bedeutsamer als sie tatsächlich sind. Wenn ich wissenschaftliche Veröffentlichungen oder Laborberichte von Studenten überprüfe, bin ich oft frustriert über diese "Sünde der Datenvisualisierung" (die meines Erachtens unbeabsichtigt begangen wird, aber …

45 data-visualization

2

Linearer Kernel und nichtlinearer Kernel für Support-Vektor-Maschine?

Gibt es Richtlinien für die Auswahl eines linearen Kernels im Vergleich zu einem nichtlinearen Kernel wie RBF, wenn Sie Support Vector Machine verwenden? Ich habe einmal gehört, dass ein nichtlinearer Kernel bei einer großen Anzahl von Features in der Regel keine gute Leistung erbringt. Gibt es Referenzen zu diesem Thema?

45 machine-learning classification svm references kernel-trick

3

Was bewirkt die Korrelation von Prädiktoren in einem multiplen Regressionsmodell?

In meiner Klasse für lineare Modelle habe ich gelernt, dass wenn zwei Prädiktoren korreliert sind und beide in einem Modell enthalten sind, einer unbedeutend ist. Nehmen Sie zum Beispiel an, dass die Größe eines Hauses und die Anzahl der Schlafzimmer miteinander korreliert sind. Wenn Sie die Kosten eines Hauses mit …

45 regression multiple-regression p-value linear-model multicollinearity

10

So zeichnen Sie Trends richtig

Ich erstelle eine Grafik, um die Trends der Sterblichkeitsraten (pro 1000 Einwohner) in verschiedenen Ländern darzustellen, und die Geschichte, die sich aus der Handlung ergeben sollte, ist, dass Deutschland (hellblaue Linie) der einzige ist, dessen Trend nach 1932 zunimmt. Dies ist Mein erster (einfacher) Versuch Meiner Meinung nach zeigt dieses …

45 data-visualization

2

Wie werden künstliche Daten für die logistische Regression simuliert?

Ich weiß, dass ich etwas in meinem Verständnis der logistischen Regression vermisse und würde mich über jede Hilfe sehr freuen. Nach meinem Verständnis geht die logistische Regression davon aus, dass die Wahrscheinlichkeit eines 1-Ergebnisses bei den Eingaben eine lineare Kombination der Eingaben ist, die durch eine inverse logistische Funktion geleitet …

45 r regression logistic generalized-linear-model simulation

4

Wie berechnet man die Wahrscheinlichkeitsdichtefunktion des Maximums einer Stichprobe von IID-Zufallsvariablen?

Angesichts der Zufallsvariablen Y=max(X1,X2,…,Xn)Y=max(X1,X2,…,Xn)Y = \max(X_1, X_2, \ldots, X_n) wo XiXiX_i sind IID einheitliche Variablen, wie berechne ich die PDF von YYY ?

45 pdf maximum

8

Gibt es einen Goldstandard für die Modellierung von Zeitreihen mit unregelmäßigen Abständen?

Im Bereich der Ökonomie (glaube ich) gibt es ARIMA und GARCH für regelmäßig verteilte Zeitreihen und Poisson, Hawkes für die Modellierung von Punktprozessen. Wie wäre es also mit Versuchen, unregelmäßig (ungleichmäßig) verteilte Zeitreihen zu modellieren - gibt es (zumindest) gängige Vorgehensweisen ? (Wenn Sie etwas über dieses Thema wissen, können …

45 time-series garch poisson-process point-process unevenly-spaced-time-series

5

R online nutzen - ohne es zu installieren [closed]

Gibt es eine Möglichkeit, R in einem Webinterface zu verwenden, ohne es installieren zu müssen? Ich habe nur ein kleines Skript, das ich gerne ausführe, aber ich möchte es nur ohne langen Installationsvorgang ausprobieren. Danke.

45 r

3

Was ist Abweichung? (speziell im WARENKORB / Teil)

Was ist "Abweichung", wie wird sie berechnet und wie werden sie in verschiedenen Bereichen der Statistik verwendet? Insbesondere interessiere ich mich persönlich für die Verwendung in CART (und die Implementierung in rpart in R). Ich frage dies, da der Wiki-Artikel etwas zu wünschen übrig lässt und Ihre Einsichten sehr willkommen …

45 r cart rpart deviance

15

Erwartete Anzahl von Verhältnissen zwischen Mädchen und Jungen

Beim Eignungstest für Vorstellungsgespräche für kritisches Denken bin ich auf eine Frage gestoßen. Es geht ungefähr so: Die Republik Zorganian hat einige sehr merkwürdige Bräuche. Paare wünschen sich nur weibliche Kinder, da nur weibliche das Vermögen der Familie erben können. Wenn sie also ein männliches Kind haben, bekommen sie so …

45 probability ratio

1

Wie funktioniert die Adam-Methode des stochastischen Gradientenabstiegs?

Ich bin mit grundlegenden Algorithmen für die Gradientenabsenkung zum Trainieren neuronaler Netze vertraut. Ich habe die Zeitung gelesen, in der Adam vorgeschlagen wird: ADAM: EINE METHODE ZUR STOCHASTISCHEN OPTIMIERUNG . Obwohl ich (zumindest) definitiv einige Einsichten habe , scheint mir das Papier insgesamt zu hoch zu sein. Beispielsweise ist eine …

45 neural-networks optimization gradient-descent adam

3

Gibt es einen Unterschied zwischen lm und glm für die Gaußsche Familie von glm?

Insbesondere möchte ich wissen, ob es einen Unterschied zwischen lm(y ~ x1 + x2)und gibt glm(y ~ x1 + x2, family=gaussian). Ich denke, dass dieser spezielle Fall von glm gleich lm ist. Liege ich falsch?

45 r normal-distribution generalized-linear-model lm

4

Normalisierung vs. Skalierung

Was ist der Unterschied zwischen Daten "Normalisierung" und Daten "Skalierung"? Bis jetzt dachte ich, beide Begriffe beziehen sich auf denselben Prozess, aber jetzt stelle ich fest, dass es noch etwas gibt, das ich nicht kenne / verstehe. Auch wenn es einen Unterschied zwischen Normalisierung und Skalierung gibt, wann sollten wir …

45 data-transformation scales normality-assumption normalization