Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren


4
Wie sollen winzige
Für einige Tests in Rgibt es eine Untergrenze für die p-Wert- Berechnungen von . Ich bin mir nicht sicher, warum es diese Nummer ist, ob es einen guten Grund dafür gibt oder ob es nur willkürlich ist. Viele andere Statistikpakete werden nur verwendet , daher ist dies ein viel höheres …



5
Warum ist der Jeffreys Prior nützlich?
Ich verstehe, dass der Jeffreys-Prior unter Umparametrierung unveränderlich ist. Was ich jedoch nicht verstehe, ist, warum diese Eigenschaft gewünscht wird. Warum möchten Sie nicht, dass sich das Vorher bei einem Variablenwechsel ändert?
61 bayesian  prior 

2
Wahrscheinlichkeitsverhältnis vs Bayes-Faktor
Ich bin ziemlich evangelistisch in Bezug auf die Verwendung von Wahrscheinlichkeitsverhältnissen zur Darstellung der objektiven Beweise für / gegen ein bestimmtes Phänomen. Kürzlich habe ich jedoch erfahren, dass der Bayes-Faktor im Kontext der Bayes-Methoden eine ähnliche Funktion hat (dh der subjektive Prior wird mit dem objektiven Bayes-Faktor kombiniert, um einen …

10
Was bedeutet "Wissenschaftler erheben sich gegen statistische Signifikanz"? (Kommentar in der Natur)
Der Titel des Kommentars in Nature Scientists, der sich gegen die statistische Signifikanz erhebt, beginnt mit: Valentin Amrhein, Sander Greenland, Blake McShane und mehr als 800 Unterzeichner fordern ein Ende der gehypten Ansprüche und die Abweisung möglicherweise entscheidender Auswirkungen. und enthält später Aussagen wie: Auch hier befürworten wir kein Verbot …


5
Welches Problem lösen Schrumpfmethoden?
Die Weihnachtszeit hat mir die Möglichkeit gegeben, mich mit den Elementen des statistischen Lernens am Feuer zu entspannen . Aus ökonometrischer Sicht (häufig) habe ich Probleme, die Verwendung von Schrumpfungsmethoden wie Ridge Regression, Lasso und Least Angle Regression (LAR) zu verstehen. Normalerweise interessiert mich die Parameterschätzung selbst und das Erreichen …


9
Wie und warum funktionieren Normalisierung und Feature-Skalierung?
Ich sehe, dass viele Algorithmen für maschinelles Lernen mit mittlerer Auslöschung und Kovarianzausgleich besser funktionieren. Beispielsweise konvergieren neuronale Netze tendenziell schneller, und K-Means bietet im Allgemeinen eine bessere Clusterbildung mit vorverarbeiteten Features. Ich sehe nicht, dass die Intuition hinter diesen Vorverarbeitungsschritten zu einer Leistungssteigerung führt. Kann mir das jemand erklären?

7
Regression mit mehreren abhängigen Variablen?
Ist es möglich, eine (multiple) Regressionsgleichung mit zwei oder mehr abhängigen Variablen zu haben? Sicher, Sie könnten zwei separate Regressionsgleichungen ausführen, eine für jeden DV, aber das scheint keine Beziehung zwischen den beiden DVs zu erfassen?
61 regression 

6
Wo kann man ein Dendrogramm schneiden?
Hierarchisches Clustering kann durch ein Dendrogramm dargestellt werden. Wenn Sie ein Dendrogramm auf einer bestimmten Ebene ausschneiden, erhalten Sie eine Reihe von Clustern. Wenn Sie auf einer anderen Ebene schneiden, erhalten Sie eine andere Gruppe von Clustern. Wie würden Sie auswählen, wo das Dendrogramm geschnitten werden soll? Gibt es etwas, …

5
Welche Beziehung besteht zwischen k-means Clustering und PCA?
Es ist gängige Praxis, PCA (Principal Component Analysis) vor einem Clustering-Algorithmus (z. B. k-means) anzuwenden. Es wird angenommen, dass es die Clustering-Ergebnisse in der Praxis verbessert (Rauschunterdrückung). Ich bin jedoch an einer vergleichenden und eingehenden Untersuchung der Beziehung zwischen PCA und k-means interessiert. Zum Beispiel Chris Ding und Xiaofeng Sich, …

6
Standardfehler für die Lasso-Vorhersage mit R
Ich versuche, ein LASSO-Modell für die Vorhersage zu verwenden, und ich muss Standardfehler abschätzen. Sicher hat schon jemand ein Paket dazu geschrieben. Aber meines Erachtens gibt keines der CRAN-Pakete, die mit einem LASSO Vorhersagen treffen, Standardfehler für diese Vorhersagen zurück. Meine Frage lautet also: Gibt es ein Paket oder einen …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.