Statistiken und Big Data

4

Ich bin auf den Begriff Ratlosigkeit gestoßen, der sich auf die logarithmisch gemittelte inverse Wahrscheinlichkeit für unsichtbare Daten bezieht. Ein Wikipedia- Artikel über Ratlosigkeit gibt keine intuitive Bedeutung dafür. Dieses Verwirrungsmaß wurde in pLSA- Papier verwendet. Kann jemand die Notwendigkeit und die intuitive Bedeutung von Ratlosigkeit erklären ?

42 measurement perplexity

6

Bedeutung der lokalen Antwortnormalisierung in CNN

Ich habe festgestellt, dass Imagenet und andere große CNN lokale Antwortnormalisierungsschichten verwenden. Ich kann jedoch nicht so viele Informationen über sie finden. Wie wichtig sind sie und wann sollten sie angewendet werden? Von http://caffe.berkeleyvision.org/tutorial/layers.html#data-layers : Die lokale Antwortnormalisierungsschicht führt eine Art "laterale Hemmung" durch, indem sie über lokale Eingaberegionen normalisiert. …

41 deep-learning convolution conv-neural-network

9

Korrelation impliziert keine Kausalität; aber was ist, wenn eine der Variablen die Zeit ist?

Ich weiß, dass diese Frage milliardenfach gestellt wurde, und bin daher nach einem Online-Blick fest davon überzeugt, dass die Korrelation zwischen zwei Variablen keine Kausalität impliziert. In einem meiner Statistikvorträge hatten wir heute einen Gastvortrag eines Physikers über die Bedeutung statistischer Methoden in der Physik. Er sagte eine erstaunliche Aussage: …

41 correlation mathematical-statistics causality

10

Warum überzeugen 600 von 1000 mehr als 6 von 10?

Sehen Sie sich diesen Auszug aus "The Study Skills Handbook", Palgrave, 2012, von Stella Cottrell, Seite 155 an: Prozentsätze Beachten Sie, wenn Prozentsätze angegeben werden. Angenommen, stattdessen lautet die obige Aussage: 60% der Menschen bevorzugten Orangen; 40% gaben an, Äpfel zu bevorzugen. Das sieht überzeugend aus: Es werden numerische Größen …

41 statistical-significance sample-size percentage

1

Neuronale Netze: Gewichtsänderungsimpuls und Gewichtsabfall

Das Momentum wird verwendet, um die Schwankungen der Gewichtsänderungen während aufeinanderfolgender Iterationen zu verringern:αα\alpha wobeiE(w)ist die Fehlerfunktionw- der Vektor der Gewichte,η- Lernrate.Δωi(t+1)=−η∂E∂wi+αΔωi(t),Δωi(t+1)=−η∂E∂wi+αΔωi(t),\Delta\omega_i(t+1) = - \eta\frac{\partial E}{\partial w_i} + \alpha \Delta \omega_i(t),E(w)E(w)E({\bf w})ww{\bf w}ηη\eta Gewichtsabnahme bestraft die Gewichtsveränderungen:λλ\lambda Δωi(t+1)=−η∂E∂wi−ληωiΔωi(t+1)=−η∂E∂wi−ληωi\Delta\omega_i(t+1) =- \eta\frac{\partial E}{\partial w_i} - \lambda\eta\omega_i Die Frage ist, ob es sinnvoll …

41 neural-networks optimization regularization gradient-descent

10

Sind Ihre Chancen, bei einem Flugzeugabsturz zu sterben, verringert, wenn Sie direkt fliegen?

Ich hatte kürzlich eine Meinungsverschiedenheit mit einem Freund über die Minimierung des Sterbens in einem Flugzeug aufgrund eines Absturzes. Dies ist eine rudimentäre Statistikfrage. Er gab an, dass er es vorzieht, direkt zu einem Ziel zu fliegen, da dies die Wahrscheinlichkeit verringert, dass er bei einem Flugzeugabsturz sterben wird. Seine …

41 independence transportation

2

Verwenden von lmer für lineare Mischeffektmodelle mit wiederholten Messungen

EDIT 2: Ursprünglich dachte ich, ich müsste eine Zweifaktor-ANOVA mit wiederholten Messungen für einen Faktor durchführen, aber jetzt denke ich, dass ein lineares Mischeffektmodell für meine Daten besser funktioniert. Ich glaube, ich weiß fast, was passieren muss, aber ich bin immer noch durch einige Punkte verwirrt. Die Experimente, die ich …

41 r anova mixed-model repeated-measures lme4-nlme

2

Pandas / Statsmodel / Scikit-lernen

Lernen Pandas, Statsmodels und Scikit unterschiedliche Implementierungen von maschinellem Lernen / statistischen Operationen oder ergänzen sich diese? Welche davon bietet die umfassendste Funktionalität? Welches wird aktiv entwickelt und / oder unterstützt? Ich muss eine logistische Regression implementieren. Irgendwelche Vorschläge, welche davon ich verwenden soll?

41 machine-learning python scikit-learn statsmodels pandas

3

Welches hat den schwereren Schwanz, lognormal oder gamma?

(Dies basiert auf einer Frage, die ich gerade per E-Mail erhalten habe. Ich habe einen Kontext aus einem vorherigen kurzen Gespräch mit derselben Person hinzugefügt.) Letztes Jahr wurde mir gesagt, dass die Gammaverteilung schwerer ist als die logarithmische Verteilung, und seitdem wurde mir mitgeteilt, dass dies nicht der Fall ist. …

41 distributions gamma-distribution lognormal heavy-tailed

5

Gute Spiele zum Erlernen des statistischen Denkens?

Gibt es Spiele, die den Spieler dazu bringen, "wie ein Statistiker zu denken"? Zum Beispiel bringt Sie Lightbot dazu, "wie ein Programmierer zu denken" (auf sehr einfache Weise). Gibt es Spiele, die für Unterhaltung oder Unterricht gedacht sind und dazu beitragen, dass man sich mit grundlegenden Konzepten wie Korrelation, p-Werten, …

41 teaching games application

7

Wie oft muss man einen 6-seitigen Würfel werfen, um jede Zahl mindestens einmal zu erhalten?

Ich habe gerade ein Spiel mit meinen Kindern gespielt, bei dem es im Grunde genommen darauf ankommt, dass jeder, der mindestens einmal auf einem 6-seitigen Würfel würfelt, gewinnt. Ich habe letztendlich gewonnen und die anderen haben 1-2 Runden später beendet. Jetzt frage ich mich: Was ist die Erwartung an die …

41 probability dice coupon-collector-problem

20

Gibt es gute Filme, in denen Mathematik oder Wahrscheinlichkeit eine Rolle spielen?

Können Sie einige gute Filme vorschlagen, die Mathematik, Wahrscheinlichkeiten usw. beinhalten? Ein Beispiel ist 21 . Ich würde mich auch für Filme interessieren, die Algorithmen beinhalten (zB Textentschlüsselung). Im Allgemeinen "geeky" Filme mit berühmten wissenschaftlichen Theorien, aber keine Science-Fiction oder Dokumentarfilme. Danke im Voraus!

41 probability references

4

OpenBugs vs. JAGS

Ich werde eine Umgebung im BUGS-Stil ausprobieren, um Bayes'sche Modelle zu schätzen. Gibt es wichtige Vorteile bei der Auswahl zwischen OpenBugs oder JAGS? Wird das eine in absehbarer Zeit das andere ersetzen? Ich werde den ausgewählten Gibbs-Sampler mit R verwenden. Ich habe noch keine spezifische Anwendung, sondern entscheide, welche ich …

41 r software bugs jags gibbs

1

Kann jemand das Konzept der Austauschbarkeit erklären?

Ich sehe das Konzept der Austauschbarkeit in verschiedenen Zusammenhängen (z. B. Bayes'schen Modellen), habe den Begriff aber nie sehr gut verstanden. Was bedeutet dieses Konzept? Unter welchen Umständen wird dieses Konzept aufgerufen und warum?

41 bayesian intuition exchangeability

1

Regression: Variablen transformieren

Müssen Sie beim Transformieren von Variablen alle dieselbe Transformation verwenden? Kann ich zum Beispiel unterschiedlich transformierte Variablen auswählen, wie in: Sei Alter, Beschäftigungsdauer, Aufenthaltsdauer und Einkommen.x1,x2,x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) Oder müssen Sie mit Ihren Transformationen konsistent sein und alle dieselben verwenden? Wie in: Y = B1*log(x1) …

41 r regression logistic data-transformation