Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

4
Welche Referenzen sollten angeführt werden, um die Verwendung von 30 als ausreichend große Stichprobe zu unterstützen?
Ich habe viele Male gelesen / gehört, dass die Stichprobengröße von mindestens 30 Einheiten als "große Stichprobe" angesehen wird (Normalitätsannahmen der Mittelwerte gelten normalerweise ungefähr aufgrund der CLT, ...). Daher generiere ich in meinen Experimenten normalerweise Proben von 30 Einheiten. Können Sie mir bitte einen Hinweis geben, der bei der …

3
Wie ist die Verteilung des euklidischen Abstandes zwischen zwei normalverteilten Zufallsvariablen?
Angenommen, Sie erhalten zwei Objekte, deren genaue Position unbekannt ist, die jedoch gemäß Normalverteilungen mit bekannten Parametern verteilt sind (z. B. a∼N(m,s)ein∼N(m,s)a \sim N(m, s) und b∼N(v,t))b∼N(v,t))b \sim N(v, t)) . Wir können annehmen, dass dies beide bivariate Normalen sind, so dass die Positionen durch eine Verteilung über (x,y)(X,y)(x,y) Koordinaten …




1
Wie werden Fehlermaßnahmen interpretiert?
Ich führe die Klassifizierung in Weka für einen bestimmten Datensatz aus und habe festgestellt, dass bei der Vorhersage eines Nominalwerts die Ausgabe speziell die korrekten und falsch vorhergesagten Werte anzeigt. Jetzt lasse ich es jedoch für ein numerisches Attribut laufen und die Ausgabe ist: Correlation coefficient 0.3305 Mean absolute error …


9
Wie werden F-Messwerte interpretiert?
Ich würde gerne wissen, wie man einen Unterschied von f-Messwerten interpretiert. Ich weiß, dass das f-Maß ein ausgewogenes Mittel zwischen Präzision und Erinnerung ist, aber ich frage nach der praktischen Bedeutung eines Unterschieds bei den f-Maßen. Wenn beispielsweise ein Klassifikator C1 eine Genauigkeit von 0,4 und ein anderer Klassifikator C2 …


5
Inwiefern unterscheiden sich Neigungsbewertungen von der Addition von Kovariaten in einer Regression, und wann werden sie letzteren vorgezogen?
Ich gebe zu, dass ich in Bezug auf Neigungsbewertungen und Kausalanalysen relativ neu bin. Eine Sache, die mir als Neuling nicht klar ist, ist, wie sich das "Ausbalancieren" unter Verwendung von Neigungsbewertungen mathematisch von dem unterscheidet, was passiert, wenn wir Kovariaten in einer Regression hinzufügen? Was ist anders an der …

1
Inwiefern unterscheidet sich softmax_cross_entropy_with_logits von softmax_cross_entropy_with_logits_v2?
Im Einzelnen wundere ich mich wohl über diese Aussage: Zukünftige Hauptversionen von TensorFlow ermöglichen es, dass Farbverläufe standardmäßig in die Beschriftungen fließen, die auf Backprop eingegeben werden. Welches wird angezeigt, wenn ich benutze tf.nn.softmax_cross_entropy_with_logits. In der gleichen Nachricht fordert es mich auf, einen Blick darauf zu werfen tf.nn.softmax_cross_entropy_with_logits_v2. Ich habe …

6
Random Forest - Wie gehe ich mit Überanpassung um?
Ich habe einen Informatik-Hintergrund, versuche mich aber Datenwissenschaft beizubringen, indem ich Probleme im Internet löse. Ich habe in den letzten Wochen an diesem Problem gearbeitet (ca. 900 Zeilen und 10 Features). Anfangs habe ich die logistische Regression verwendet, jetzt bin ich zu zufälligen Wäldern gewechselt. Wenn ich mein Zufallswaldmodell mit …

3
Wie kann ich berechnen
Angenommen, und Φ ( ⋅ )ϕ(⋅)ϕ(⋅)\phi(\cdot)Φ(⋅)Φ(⋅)\Phi(\cdot) sind Dichtefunktion und Verteilungsfunktion der Standardnormalverteilung. Wie kann man das Integral berechnen: ∫∞−∞Φ(w−ab)ϕ(w)dw∫-∞∞Φ(w-einb)ϕ(w)dw\int^{\infty}_{-\infty}\Phi\left(\frac{w-a}{b}\right)\phi(w)\,\mathrm dw

3
Bedeutet statistische Unabhängigkeit einen Mangel an Kausalität?
Zwei Zufallsvariablen A und B sind statistisch unabhängig. Das bedeutet im DAG des Prozesses: und natürlich . Aber heißt das auch, dass es von B nach A keine Haustür gibt?(A⊥⊥B)(A⊥⊥B)(A {\perp\!\!\!\perp} B)P(A|B)=P(A)P(A|B)=P(A)P(A|B)=P(A) Denn dann sollten wir . Wenn dies der Fall ist, bedeutet statistische Unabhängigkeit dann automatisch einen Mangel an …

4
Warum Sigmoid-Funktion anstelle von irgendetwas anderem?
Warum ist die De-facto-Standard-Sigmoid-Funktion in (nicht-tiefen) neuronalen Netzwerken und logistischen Regressionen so beliebt?11+e−x11+e−x\frac{1}{1+e^{-x}} Warum verwenden wir nicht viele der anderen ableitbaren Funktionen mit einer schnelleren Rechenzeit oder einem langsameren Zerfall (so dass der Gradient weniger verschwindet)? In Wikipedia gibt es nur wenige Beispiele für Sigmoidfunktionen . Einer meiner Favoriten mit …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.