Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

2
Form des Konfidenzintervalls für vorhergesagte Werte in der linearen Regression
Ich habe festgestellt, dass das Konfidenzintervall für vorhergesagte Werte in einer linearen Regression um den Mittelwert des Prädiktors und Fett um den minimalen und den maximalen Wert des Prädiktors eng ist. Dies ist in den Diagrammen dieser 4 linearen Regressionen zu sehen: Anfangs dachte ich, dies liege daran, dass die …







4
Wie wird eine Standardabweichung "summiert"?
Ich habe einen monatlichen Durchschnitt für einen Wert und eine Standardabweichung, die diesem Durchschnitt entspricht. Ich berechne jetzt den Jahresdurchschnitt als Summe der Monatsdurchschnitte. Wie kann ich die Standardabweichung für den summierten Durchschnitt darstellen? Ein Beispiel für die Leistung eines Windparks: Month MWh StdDev January 927 333 February 1234 250 …

10
Was ist falsch an der Hochrechnung?
Ich erinnere mich, als Student in Statistikkursen gesessen zu haben, warum Hochrechnung eine schlechte Idee war. Darüber hinaus gibt es eine Vielzahl von Online-Quellen, die dies kommentieren. Es gibt auch eine Erwähnung hier . Kann mir jemand helfen zu verstehen, warum Extrapolation eine schlechte Idee ist? Wenn ja, wie kommt …

2
Multivariate multiple Regression in R
Ich habe 2 abhängige Variablen (DVs), deren Punktzahl durch die Menge von 7 unabhängigen Variablen (IVs) beeinflusst werden kann. DVs sind kontinuierlich, während der Satz von IVs aus einer Mischung aus kontinuierlichen und binär codierten Variablen besteht. (Im folgenden Code werden fortlaufende Variablen in Großbuchstaben und binäre Variablen in Kleinbuchstaben …


11
Warum sollte ich Bayesianer sein, wenn mein Modell falsch ist?
Änderungen: Ich habe ein einfaches Beispiel hinzugefügt: Rückschluss auf den Mittelwert von . Ich habe auch leicht geklärt, warum die glaubwürdigen Intervalle, die nicht mit den Konfidenzintervallen übereinstimmen, schlecht sind.XiXiX_i Ich, ein ziemlich gläubiger Bayesianer, bin mitten in einer Art Glaubenskrise. Mein Problem ist folgendes. Angenommen, ich möchte einige IID-Daten …

1
40.000 neurowissenschaftliche Artikel könnten falsch sein
Ich habe diesen Artikel im Economist über ein anscheinend verheerendes Papier [1] gesehen, das Zweifel an "etwa 40.000 veröffentlichten [fMRI] -Studien" aufwirft. Der Fehler liege an "falschen statistischen Annahmen". Ich habe das Papier gelesen und sehe, dass es teilweise ein Problem mit mehreren Vergleichskorrekturen ist, aber ich bin kein fMRI-Experte …

3
Ist dies die Lösung für das p-Wert-Problem?
Im Februar 2016 veröffentlichte die American Statistical Association eine formelle Erklärung zur statistischen Signifikanz und zu den p-Werten. In unserem Thread werden diese Themen ausführlich behandelt. Es hat sich jedoch bisher keine Autorität herauskristallisiert, um eine allgemein anerkannte wirksame Alternative anzubieten. Die American Statistical Society (ASS) hat ihre Antwort veröffentlicht, …

6
Variablenauswahl für prädiktive Modellierung im Jahr 2016 wirklich erforderlich?
Diese Frage wurde bereits vor einigen Jahren im Lebenslauf gestellt. Angesichts von 1) um Größenordnungen besserer Computertechnologie (z. B. Parallel Computing, HPC usw.) und 2) neuerer Techniken, z. Erstens einen Kontext. Nehmen wir an, das Ziel ist nicht das Testen von Hypothesen, nicht das Schätzen von Effekten, sondern die Vorhersage …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.