Statistiken und Big Data statistical-significance

9

Funktionieren p-Werte wirklich so? Kann eine Million Forschungsarbeiten pro Jahr auf Zufälligkeit beruhen?

Ich bin sehr neu in der Statistik und lerne gerade, die Grundlagen zu verstehen, einschließlich der Werte. Aber ich habe gerade ein großes Fragezeichen im Kopf und hoffe, dass mein Verständnis falsch ist. Hier ist mein Denkprozess:ppp Sind nicht alle Forschungen auf der Welt ähnlich wie die Affen im "Satz …

98 hypothesis-testing statistical-significance p-value

2

Wie viel wissen wir über P-Hacking in freier Wildbahn?

Der Ausdruck p- Hacking (auch: " Datenbaggern " , "Schnüffeln" oder "Fischen") bezieht sich auf verschiedene Arten statistischer Verfehlungen, bei denen Ergebnisse künstlich statistisch signifikant werden. Es gibt viele Möglichkeiten, ein "signifikanteres" Ergebnis zu erzielen, unter anderem: nur Analysieren einer "interessanten" Teilmenge der Daten , in denen ein Muster gefunden …

94 hypothesis-testing statistical-significance p-value model-selection reproducible-research

9

Warum 1% und 5% in Bezug auf p-Werte? Warum nicht 6% oder 10%?

In Bezug auf den p-Wert s frage ich mich, warum 111 % und % der Goldstandard zu sein scheinen . Warum nicht andere Werte wie 6 % oder 10 %?555"statistical significance"666101010 Gibt es einen fundamentalen mathematischen Grund dafür oder handelt es sich nur um eine weit verbreitete Konvention?

80 hypothesis-testing statistical-significance p-value history

3

Ein Beispiel: LASSO-Regression unter Verwendung von glmnet für binäre Ergebnisse

Ich beginne mit der Verwendung von dabble glmnetmit LASSO Regression , wo mein Ergebnis von Interesse dichotomous ist. Ich habe unten einen kleinen nachgebildeten Datenrahmen erstellt: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- …

77 r self-study lasso regression interpretation anova statistical-significance survey conditional-probability independence naive-bayes graphical-model r time-series forecasting arima r forecasting exponential-smoothing bootstrap outliers r regression poisson-distribution zero-inflation genetic-algorithms machine-learning feature-selection cart categorical-data interpretation descriptive-statistics variance multivariate-analysis covariance-matrix r data-visualization generalized-linear-model binomial proportion pca matlab svd time-series correlation spss arima chi-squared curve-fitting text-mining zipf probability categorical-data distance group-differences bhattacharyya regression variance mean data-visualization variance clustering r standard-error association-measure somers-d normal-distribution integral numerical-integration bayesian clustering python pymc nonparametric-bayes machine-learning svm kernel-trick hyperparameter poisson-distribution mean continuous-data univariate missing-data dag python likelihood dirichlet-distribution r anova hypothesis-testing statistical-significance p-value rating data-imputation censoring threshold

3

Ist dies die Lösung für das p-Wert-Problem?

Im Februar 2016 veröffentlichte die American Statistical Association eine formelle Erklärung zur statistischen Signifikanz und zu den p-Werten. In unserem Thread werden diese Themen ausführlich behandelt. Es hat sich jedoch bisher keine Autorität herauskristallisiert, um eine allgemein anerkannte wirksame Alternative anzubieten. Die American Statistical Society (ASS) hat ihre Antwort veröffentlicht, …

67 hypothesis-testing statistical-significance p-value

3

Referenzen mit Argumenten gegen das Testen der Signifikanz von Nullhypothesen?

In den letzten Jahren habe ich eine Reihe von Artikeln gelesen, die sich gegen die Verwendung von Nullhypothesen-Signifikanztests in der Wissenschaft aussprachen, aber nicht daran gedacht, eine ständige Liste zu führen. Ein Kollege hat mich kürzlich nach einer solchen Liste gefragt, und ich dachte, ich würde alle hier bitten, bei …

63 hypothesis-testing statistical-significance references p-value

10

Was bedeutet "Wissenschaftler erheben sich gegen statistische Signifikanz"? (Kommentar in der Natur)

Der Titel des Kommentars in Nature Scientists, der sich gegen die statistische Signifikanz erhebt, beginnt mit: Valentin Amrhein, Sander Greenland, Blake McShane und mehr als 800 Unterzeichner fordern ein Ende der gehypten Ansprüche und die Abweisung möglicherweise entscheidender Auswirkungen. und enthält später Aussagen wie: Auch hier befürworten wir kein Verbot …

61 statistical-significance p-value bias

3

Erkläre den xkcd-Gummibärchen-Comic: Was macht es lustig?

Ich sehe, dass einmal von den insgesamt zwanzig Tests, die sie durchführen, , so dass sie fälschlicherweise annehmen, dass während eines der zwanzig Tests das Ergebnis signifikant ist ( ).0,05 = 1 / 20p < 0,05p<0.05p < 0.050,05 = 1 / 200.05=1/200.05 = 1/20 xkcd Gummibärchen-Comic - "Signifikant" Titel: Bedeutend …

60 hypothesis-testing statistical-significance confidence-interval p-value humor

12

Zweischwänzige Tests… ich bin einfach nicht überzeugt. Was ist der Punkt?

Der folgende Auszug stammt aus dem Beitrag: Was sind die Unterschiede zwischen einseitigen und zweiseitigen Tests? , auf der Statistik-Hilfeseite der UCLA. ... überlegen Sie, welche Konsequenzen das Ausbleiben eines Effekts in die andere Richtung hat. Stellen Sie sich vor, Sie haben ein neues Medikament entwickelt, von dem Sie glauben, …

59 hypothesis-testing statistical-significance inference

6

Ist der "Hybrid" zwischen Fisher und Neyman-Pearson bei statistischen Tests wirklich ein "inkohärenter Mischmasch"?

Es gibt eine bestimmte Denkrichtung, nach der der am weitesten verbreitete Ansatz für statistische Tests ein "Hybrid" zwischen zwei Ansätzen ist: dem von Fisher und dem von Neyman-Pearson; Diese beiden Ansätze seien "inkompatibel", und daher sei der resultierende "Hybrid" ein "inkohärenter Mischmasch". Ich werde im Folgenden eine Bibliographie und einige …

56 hypothesis-testing statistical-significance p-value type-i-and-ii-errors history

2

Benötigen wir einen globalen Test vor Post-Hoc-Tests?

Ich höre oft, dass Post-hoc-Tests nach einer ANOVA nur verwendet werden können, wenn die ANOVA selbst signifikant war. Bei Post-Hoc-Tests werden jedoch die Werte angepasst, um die globale Typ-I-Fehlerrate bei 5% zu halten, nicht wahr?ppp Warum brauchen wir also zuerst den globalen Test? Wenn wir keinen globalen Test benötigen, ist …

54 anova statistical-significance post-hoc

4

Manuelles Berechnen des P-Werts aus dem t-Wert im t-Test

Ich habe einen Beispieldatensatz mit 31 Werten. Ich habe einen zweiseitigen t-Test mit R durchgeführt, um zu testen, ob der wahre Mittelwert gleich 10 ist: t.test(x=data, mu=10, conf.level=0.95) Ausgabe: t = 11.244, df = 30, p-value = 2.786e-12 alternative hypothesis: true mean is not equal to 10 95 percent confidence …

49 r statistical-significance t-test p-value

7

Warum ist "statistisch signifikant" nicht genug?

Ich habe meine Datenanalyse abgeschlossen und "statistisch signifikante Ergebnisse" erhalten, was mit meiner Hypothese übereinstimmt. Ein Student der Statistik sagte mir jedoch, dies sei eine vorzeitige Schlussfolgerung. Warum? Muss mein Bericht noch etwas anderes enthalten?

46 hypothesis-testing statistical-significance spss p-value

3

Interpretation des log transformierten Prädiktors und / oder der Antwort

Ich frage mich, ob es einen Unterschied in der Interpretation macht, ob nur die abhängigen, sowohl die abhängigen als auch die unabhängigen Variablen oder nur die unabhängigen Variablen log-transformiert werden. Betrachten Sie den Fall von log(DV) = Intercept + B1*IV + Error Ich kann die IV als prozentuale Erhöhung interpretieren, …

46 regression data-transformation interpretation regression-coefficients logarithm r dataset stata hypothesis-testing contingency-tables hypothesis-testing statistical-significance standard-deviation unbiased-estimator t-distribution r functional-data-analysis maximum-likelihood bootstrap regression change-point regression sas hypothesis-testing bayesian randomness predictive-models nonparametric terminology parametric correlation effect-size loess mean pdf quantile-function bioinformatics regression terminology r-squared pdf maximum multivariate-analysis references data-visualization r pca r mixed-model lme4-nlme distributions probability bayesian prior anova chi-squared binomial generalized-linear-model anova repeated-measures t-test post-hoc clustering variance probability hypothesis-testing references binomial profile-likelihood self-study excel data-transformation skewness distributions statistical-significance econometrics spatial r regression anova spss linear-model

4

Warum sagen Statistiker, dass ein nicht signifikantes Ergebnis bedeutet, dass Sie die Null nicht ablehnen können, anstatt die Nullhypothese zu akzeptieren?

Traditionelle statistische Tests wie der Zwei-Stichproben-T-Test konzentrieren sich darauf, die Hypothese zu beseitigen, dass es keinen Unterschied zwischen einer Funktion von zwei unabhängigen Stichproben gibt. Dann wählen wir ein Konfidenzniveau und sagen, dass wir die Nullhypothese ablehnen können, wenn die Differenz der Mittelwerte jenseits des 95% -Niveaus liegt. Wenn nicht, …

44 hypothesis-testing statistical-significance confidence-interval equivalence tost

Als «statistical-significance» getaggte Fragen