Statistiken und Big Data

10

Was ist der Unterschied zwischen diskreten und kontinuierlichen Daten?

62 continuous-data discrete-data

4

Für einige Tests in Rgibt es eine Untergrenze für die p-Wert- Berechnungen von . Ich bin mir nicht sicher, warum es diese Nummer ist, ob es einen guten Grund dafür gibt oder ob es nur willkürlich ist. Viele andere Statistikpakete werden nur verwendet , daher ist dies ein viel höheres …

62 r p-value reporting precision

4

Entspricht die Varianz einer Summe der Summe der Varianzen?

Ist es (immer) wahr, dass Var(∑i=1mXi)=∑i=1mVar(Xi)?Var(∑i=1mXi)=∑i=1mVar(Xi)?\mathrm{Var}\left(\sum\limits_{i=1}^m{X_i}\right) = \sum\limits_{i=1}^m{\mathrm{Var}(X_i)} \>?

62 variance

3

Wer hat die erste Standardtabelle erstellt?

Ich bin dabei, die normale Standardtabelle in meiner Einführungsstatistikklasse einzuführen, und das hat mich gefragt: Wer hat die erste normale Standardtabelle erstellt? Wie haben sie es gemacht, bevor Computer kamen? Ich schaudere, wenn ich an jemanden denke, der tausend Riemann-Summen von Hand berechnet.

61 normal-distribution algorithms history tables

5

Warum ist der Jeffreys Prior nützlich?

Ich verstehe, dass der Jeffreys-Prior unter Umparametrierung unveränderlich ist. Was ich jedoch nicht verstehe, ist, warum diese Eigenschaft gewünscht wird. Warum möchten Sie nicht, dass sich das Vorher bei einem Variablenwechsel ändert?

61 bayesian prior

2

Wahrscheinlichkeitsverhältnis vs Bayes-Faktor

Ich bin ziemlich evangelistisch in Bezug auf die Verwendung von Wahrscheinlichkeitsverhältnissen zur Darstellung der objektiven Beweise für / gegen ein bestimmtes Phänomen. Kürzlich habe ich jedoch erfahren, dass der Bayes-Faktor im Kontext der Bayes-Methoden eine ähnliche Funktion hat (dh der subjektive Prior wird mit dem objektiven Bayes-Faktor kombiniert, um einen …

61 likelihood-ratio bayes-factors

10

Was bedeutet "Wissenschaftler erheben sich gegen statistische Signifikanz"? (Kommentar in der Natur)

Der Titel des Kommentars in Nature Scientists, der sich gegen die statistische Signifikanz erhebt, beginnt mit: Valentin Amrhein, Sander Greenland, Blake McShane und mehr als 800 Unterzeichner fordern ein Ende der gehypten Ansprüche und die Abweisung möglicherweise entscheidender Auswirkungen. und enthält später Aussagen wie: Auch hier befürworten wir kein Verbot …

61 statistical-significance p-value bias

2

Warum nur drei Partitionen? (Training, Validierung, Test)

Wenn Sie versuchen, Modelle an ein großes Dataset anzupassen, besteht der allgemeine Rat darin, die Daten in drei Teile zu unterteilen: das Training, die Validierung und das Test-Dataset. Dies liegt daran, dass die Modelle normalerweise drei "Parameterebenen" haben: Der erste "Parameter" ist die Modellklasse (z. B. SVM, neuronales Netzwerk, zufällige …

61 machine-learning model-selection data-mining

5

Welches Problem lösen Schrumpfmethoden?

Die Weihnachtszeit hat mir die Möglichkeit gegeben, mich mit den Elementen des statistischen Lernens am Feuer zu entspannen . Aus ökonometrischer Sicht (häufig) habe ich Probleme, die Verwendung von Schrumpfungsmethoden wie Ridge Regression, Lasso und Least Angle Regression (LAR) zu verstehen. Normalerweise interessiert mich die Parameterschätzung selbst und das Erreichen …

61 lasso ridge-regression shrinkage lars

6

Was ist der Unterschied zwischen einem "verschachtelten" und einem "nicht verschachtelten" Modell?

In der Literatur zu hierarchischen / mehrstufigen Modellen habe ich oft über "verschachtelte Modelle" und "nicht verschachtelte Modelle" gelesen, aber was bedeutet das? Könnte mir vielleicht jemand einige Beispiele geben oder mir die mathematischen Implikationen dieser Formulierung erklären?

61 hypothesis-testing terminology nested-models nested-data

9

Wie und warum funktionieren Normalisierung und Feature-Skalierung?

Ich sehe, dass viele Algorithmen für maschinelles Lernen mit mittlerer Auslöschung und Kovarianzausgleich besser funktionieren. Beispielsweise konvergieren neuronale Netze tendenziell schneller, und K-Means bietet im Allgemeinen eine bessere Clusterbildung mit vorverarbeiteten Features. Ich sehe nicht, dass die Intuition hinter diesen Vorverarbeitungsschritten zu einer Leistungssteigerung führt. Kann mir das jemand erklären?

61 machine-learning neural-networks covariance normalization

7

Regression mit mehreren abhängigen Variablen?

Ist es möglich, eine (multiple) Regressionsgleichung mit zwei oder mehr abhängigen Variablen zu haben? Sicher, Sie könnten zwei separate Regressionsgleichungen ausführen, eine für jeden DV, aber das scheint keine Beziehung zwischen den beiden DVs zu erfassen?

61 regression

6

Wo kann man ein Dendrogramm schneiden?

Hierarchisches Clustering kann durch ein Dendrogramm dargestellt werden. Wenn Sie ein Dendrogramm auf einer bestimmten Ebene ausschneiden, erhalten Sie eine Reihe von Clustern. Wenn Sie auf einer anderen Ebene schneiden, erhalten Sie eine andere Gruppe von Clustern. Wie würden Sie auswählen, wo das Dendrogramm geschnitten werden soll? Gibt es etwas, …

61 clustering dendrogram

5

Welche Beziehung besteht zwischen k-means Clustering und PCA?

Es ist gängige Praxis, PCA (Principal Component Analysis) vor einem Clustering-Algorithmus (z. B. k-means) anzuwenden. Es wird angenommen, dass es die Clustering-Ergebnisse in der Praxis verbessert (Rauschunterdrückung). Ich bin jedoch an einer vergleichenden und eingehenden Untersuchung der Beziehung zwischen PCA und k-means interessiert. Zum Beispiel Chris Ding und Xiaofeng Sich, …

61 clustering pca k-means

6

Standardfehler für die Lasso-Vorhersage mit R

Ich versuche, ein LASSO-Modell für die Vorhersage zu verwenden, und ich muss Standardfehler abschätzen. Sicher hat schon jemand ein Paket dazu geschrieben. Aber meines Erachtens gibt keines der CRAN-Pakete, die mit einem LASSO Vorhersagen treffen, Standardfehler für diese Vorhersagen zurück. Meine Frage lautet also: Gibt es ein Paket oder einen …

60 r standard-error prediction lasso