Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

4
Was ist Ratlosigkeit?
Ich bin auf den Begriff Ratlosigkeit gestoßen, der sich auf die logarithmisch gemittelte inverse Wahrscheinlichkeit für unsichtbare Daten bezieht. Ein Wikipedia- Artikel über Ratlosigkeit gibt keine intuitive Bedeutung dafür. Dieses Verwirrungsmaß wurde in pLSA- Papier verwendet. Kann jemand die Notwendigkeit und die intuitive Bedeutung von Ratlosigkeit erklären ?

6
Bedeutung der lokalen Antwortnormalisierung in CNN
Ich habe festgestellt, dass Imagenet und andere große CNN lokale Antwortnormalisierungsschichten verwenden. Ich kann jedoch nicht so viele Informationen über sie finden. Wie wichtig sind sie und wann sollten sie angewendet werden? Von http://caffe.berkeleyvision.org/tutorial/layers.html#data-layers : Die lokale Antwortnormalisierungsschicht führt eine Art "laterale Hemmung" durch, indem sie über lokale Eingaberegionen normalisiert. …

9
Korrelation impliziert keine Kausalität; aber was ist, wenn eine der Variablen die Zeit ist?
Ich weiß, dass diese Frage milliardenfach gestellt wurde, und bin daher nach einem Online-Blick fest davon überzeugt, dass die Korrelation zwischen zwei Variablen keine Kausalität impliziert. In einem meiner Statistikvorträge hatten wir heute einen Gastvortrag eines Physikers über die Bedeutung statistischer Methoden in der Physik. Er sagte eine erstaunliche Aussage: …

10
Warum überzeugen 600 von 1000 mehr als 6 von 10?
Sehen Sie sich diesen Auszug aus "The Study Skills Handbook", Palgrave, 2012, von Stella Cottrell, Seite 155 an: Prozentsätze Beachten Sie, wenn Prozentsätze angegeben werden. Angenommen, stattdessen lautet die obige Aussage: 60% der Menschen bevorzugten Orangen; 40% gaben an, Äpfel zu bevorzugen. Das sieht überzeugend aus: Es werden numerische Größen …

1
Neuronale Netze: Gewichtsänderungsimpuls und Gewichtsabfall
Das Momentum wird verwendet, um die Schwankungen der Gewichtsänderungen während aufeinanderfolgender Iterationen zu verringern:αα\alpha wobeiE(w)ist die Fehlerfunktionw- der Vektor der Gewichte,η- Lernrate.Δωi(t+1)=−η∂E∂wi+αΔωi(t),Δωi(t+1)=−η∂E∂wi+αΔωi(t),\Delta\omega_i(t+1) = - \eta\frac{\partial E}{\partial w_i} + \alpha \Delta \omega_i(t),E(w)E(w)E({\bf w})ww{\bf w}ηη\eta Gewichtsabnahme bestraft die Gewichtsveränderungen:λλ\lambda Δωi(t+1)=−η∂E∂wi−ληωiΔωi(t+1)=−η∂E∂wi−ληωi\Delta\omega_i(t+1) =- \eta\frac{\partial E}{\partial w_i} - \lambda\eta\omega_i Die Frage ist, ob es sinnvoll …



2
Pandas / Statsmodel / Scikit-lernen
Lernen Pandas, Statsmodels und Scikit unterschiedliche Implementierungen von maschinellem Lernen / statistischen Operationen oder ergänzen sich diese? Welche davon bietet die umfassendste Funktionalität? Welches wird aktiv entwickelt und / oder unterstützt? Ich muss eine logistische Regression implementieren. Irgendwelche Vorschläge, welche davon ich verwenden soll?


5
Gute Spiele zum Erlernen des statistischen Denkens?
Gibt es Spiele, die den Spieler dazu bringen, "wie ein Statistiker zu denken"? Zum Beispiel bringt Sie Lightbot dazu, "wie ein Programmierer zu denken" (auf sehr einfache Weise). Gibt es Spiele, die für Unterhaltung oder Unterricht gedacht sind und dazu beitragen, dass man sich mit grundlegenden Konzepten wie Korrelation, p-Werten, …



4
OpenBugs vs. JAGS
Ich werde eine Umgebung im BUGS-Stil ausprobieren, um Bayes'sche Modelle zu schätzen. Gibt es wichtige Vorteile bei der Auswahl zwischen OpenBugs oder JAGS? Wird das eine in absehbarer Zeit das andere ersetzen? Ich werde den ausgewählten Gibbs-Sampler mit R verwenden. Ich habe noch keine spezifische Anwendung, sondern entscheide, welche ich …
41 r  software  bugs  jags  gibbs 


1
Regression: Variablen transformieren
Müssen Sie beim Transformieren von Variablen alle dieselbe Transformation verwenden? Kann ich zum Beispiel unterschiedlich transformierte Variablen auswählen, wie in: Sei Alter, Beschäftigungsdauer, Aufenthaltsdauer und Einkommen.x1,x2,x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) Oder müssen Sie mit Ihren Transformationen konsistent sein und alle dieselben verwenden? Wie in: Y = B1*log(x1) …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.