Statistiken und Big Data

2

Form des Konfidenzintervalls für vorhergesagte Werte in der linearen Regression

Ich habe festgestellt, dass das Konfidenzintervall für vorhergesagte Werte in einer linearen Regression um den Mittelwert des Prädiktors und Fett um den minimalen und den maximalen Wert des Prädiktors eng ist. Dies ist in den Diagrammen dieser 4 linearen Regressionen zu sehen: Anfangs dachte ich, dies liege daran, dass die …

69 regression confidence-interval linear-model standard-error prediction-interval

5

Kendall Tau oder Spearman's Rho?

In welchen Fällen sollte man den einen dem anderen vorziehen? Ich habe jemanden gefunden, der aus pädagogischen Gründen einen Vorteil für Kendall beansprucht. Gibt es noch andere Gründe?

69 correlation nonparametric spearman-rho kendall-tau

19

Was sind einige wertvolle Open-Source-Projekte zur statistischen Analyse?

Welche wertvollen Open-Source-Projekte für die statistische Analyse sind derzeit verfügbar? Bearbeiten: Wie von Sharpie hervorgehoben, kann wertvoll bedeuten, Ihnen dabei zu helfen, Dinge schneller oder billiger zu erledigen.

69 software open-source

8

Was ist mit einer Zufallsvariablen gemeint?

Was bedeuten sie, wenn sie "Zufallsvariable" sagen?

69 mathematical-statistics random-variable intuition definition

4

Wie werden Hyperparameter von xgboost-Bäumen optimiert?

Ich habe klassenunausgeglichene Daten und möchte die Hyperparameter der verstärkten Locke mit xgboost optimieren. Fragen Gibt es für xgboost ein Äquivalent zu gridsearchcv oder randomsearchcv? Wenn nicht, was ist der empfohlene Ansatz, um die Parameter von xgboost zu optimieren?

68 machine-learning cross-validation xgboost boosting

6

Was sind gute Anfangsgewichte in einem neuronalen Netzwerk?

Ich habe gerade gehört, dass es eine gute Idee ist, die Anfangsgewichte eines neuronalen Netzes aus dem Bereich zu wählen , wobei ist Anzahl der Eingaben in ein bestimmtes Neuron. Es wird angenommen, dass die Mengen normalisiert sind - Mittelwert 0, Varianz 1 (weiß nicht, ob dies wichtig ist).d( - …

68 neural-networks normalization

7

Benötigen alle Interaktionsbegriffe ihre individuellen Begriffe im Regressionsmodell?

Ich überprüfe gerade ein Manuskript, in dem die Autoren 5-6 logit-Regressionsmodelle mit AIC vergleichen. Einige Modelle haben jedoch Interaktionsterme ohne Berücksichtigung der einzelnen kovariaten Terme. Hat es jemals Sinn, dies zu tun? Zum Beispiel (nicht spezifisch für Logit-Modelle): M1: Y = X1 + X2 + X1*X2 M2: Y = X1 …

68 regression modeling interaction aic

4

Wie wird eine Standardabweichung "summiert"?

Ich habe einen monatlichen Durchschnitt für einen Wert und eine Standardabweichung, die diesem Durchschnitt entspricht. Ich berechne jetzt den Jahresdurchschnitt als Summe der Monatsdurchschnitte. Wie kann ich die Standardabweichung für den summierten Durchschnitt darstellen? Ein Beispiel für die Leistung eines Windparks: Month MWh StdDev January 927 333 February 1234 250 …

68 standard-deviation descriptive-statistics

10

Was ist falsch an der Hochrechnung?

Ich erinnere mich, als Student in Statistikkursen gesessen zu haben, warum Hochrechnung eine schlechte Idee war. Darüber hinaus gibt es eine Vielzahl von Online-Quellen, die dies kommentieren. Es gibt auch eine Erwähnung hier . Kann mir jemand helfen zu verstehen, warum Extrapolation eine schlechte Idee ist? Wenn ja, wie kommt …

68 regression time-series forecasting

2

Multivariate multiple Regression in R

Ich habe 2 abhängige Variablen (DVs), deren Punktzahl durch die Menge von 7 unabhängigen Variablen (IVs) beeinflusst werden kann. DVs sind kontinuierlich, während der Satz von IVs aus einer Mischung aus kontinuierlichen und binär codierten Variablen besteht. (Im folgenden Code werden fortlaufende Variablen in Großbuchstaben und binäre Variablen in Kleinbuchstaben …

68 r multivariate-analysis manova multiple-regression multivariate-regression

7

Wie werden gleichmäßig verteilte Punkte auf der Oberfläche der 3D-Einheitskugel erzeugt?

Ich frage mich, wie man gleichmäßig verteilte Punkte auf der Oberfläche der 3D-Einheitskugel erzeugt. Was ist nach dem Erzeugen dieser Punkte der beste Weg, um zu visualisieren und zu überprüfen, ob sie auf der Oberfläche wirklich einheitlich sind ?x2+y2+z2=1x2+y2+z2=1x^2+y^2+z^2=1

68 random-generation

11

Warum sollte ich Bayesianer sein, wenn mein Modell falsch ist?

Änderungen: Ich habe ein einfaches Beispiel hinzugefügt: Rückschluss auf den Mittelwert von . Ich habe auch leicht geklärt, warum die glaubwürdigen Intervalle, die nicht mit den Konfidenzintervallen übereinstimmen, schlecht sind.XiXiX_i Ich, ein ziemlich gläubiger Bayesianer, bin mitten in einer Art Glaubenskrise. Mein Problem ist folgendes. Angenommen, ich möchte einige IID-Daten …

68 bayesian modeling philosophical misspecification

1

40.000 neurowissenschaftliche Artikel könnten falsch sein

Ich habe diesen Artikel im Economist über ein anscheinend verheerendes Papier [1] gesehen, das Zweifel an "etwa 40.000 veröffentlichten [fMRI] -Studien" aufwirft. Der Fehler liege an "falschen statistischen Annahmen". Ich habe das Papier gelesen und sehe, dass es teilweise ein Problem mit mehreren Vergleichskorrekturen ist, aber ich bin kein fMRI-Experte …

67 hypothesis-testing multiple-comparisons spatial neuroimaging neuroscience

3

Ist dies die Lösung für das p-Wert-Problem?

Im Februar 2016 veröffentlichte die American Statistical Association eine formelle Erklärung zur statistischen Signifikanz und zu den p-Werten. In unserem Thread werden diese Themen ausführlich behandelt. Es hat sich jedoch bisher keine Autorität herauskristallisiert, um eine allgemein anerkannte wirksame Alternative anzubieten. Die American Statistical Society (ASS) hat ihre Antwort veröffentlicht, …

67 hypothesis-testing statistical-significance p-value

6

Variablenauswahl für prädiktive Modellierung im Jahr 2016 wirklich erforderlich?

Diese Frage wurde bereits vor einigen Jahren im Lebenslauf gestellt. Angesichts von 1) um Größenordnungen besserer Computertechnologie (z. B. Parallel Computing, HPC usw.) und 2) neuerer Techniken, z. Erstens einen Kontext. Nehmen wir an, das Ziel ist nicht das Testen von Hypothesen, nicht das Schätzen von Effekten, sondern die Vorhersage …

67 machine-learning modeling feature-selection model-selection prediction