Statistiken und Big Data p-value

2

Palantirs asiatischer Diskriminierungsfall: Wie wurden die Wahrscheinlichkeiten berechnet?

Ich habe diesen Artikel über Palantirs Fall gelesen, in dem die Abteilung für Arbeit sie beschuldigt, Asiaten diskriminiert zu haben. Weiß jemand, woher diese Wahrscheinlichkeitsschätzungen stammen? Ich erhalte nicht 1/741 in Punkt (a). (a) Für die Position als QA-Ingenieur stellte Palantir aus einem Pool von mehr als 730 qualifizierten Bewerbern …

14 probability p-value contingency-tables legal

3

Ist p = 5,0% signifikant?

Heute wurde ich gefragt, ob ein p-Wert von 0,05 (genau) als signifikant angesehen wird (gegebenes Alpha = 5%) oder nicht. Ich kannte die Antwort nicht und Google stellte beide Antworten auf: (a) Das Ergebnis ist signifikant, wenn p weniger als 5% und (b) wenn p weniger als 5% oder gleich …

14 hypothesis-testing statistical-significance p-value

5

Warum gibt mir die Anwendung der Modellauswahl mit AIC nicht signifikante p-Werte für die Variablen?

Ich habe einige Fragen zum AIC und hoffe, dass Sie mir helfen können. Ich habe die Modellauswahl (vorwärts oder rückwärts) basierend auf dem AIC auf meine Daten angewendet. Und einige der ausgewählten Variablen haben am Ende einen p-Wert> 0,05. Ich weiß, dass die Leute sagen, wir sollten Modelle basierend auf …

14 model-selection p-value aic

2

Berechnung des p-Wertes aus einer beliebigen Verteilung

Ich hoffe, das ist keine dumme Frage. Nehmen wir an, ich habe eine willkürliche kontinuierliche Verteilung. Ich habe auch eine Statistik und möchte diese beliebige Verteilung verwenden, um einen p-Wert für diese Statistik zu erhalten. Mir ist klar, dass es in R einfach ist, dies zu tun, solange Ihre Distribution …

14 r distributions p-value

2

Wie lautet die Formel für den Benjamini-Hochberg-bereinigten p-Wert?

Ich verstehe das Verfahren und was es steuert. Wie lautet also die Formel für den angepassten p-Wert in der BH-Prozedur für Mehrfachvergleiche? In diesem Moment wurde mir klar, dass das ursprüngliche BH keine angepassten p-Werte produziert, sondern nur die (nicht-) Ablehnungsbedingung angepasst hat: https://www.jstor.org/stable/2346101 . Gordon Smyth hat 2002 ohnehin …

14 hypothesis-testing p-value multiple-comparisons false-discovery-rate

3

Wie berechnet man die Wahrscheinlichkeit, die mit absurd großen Z-Scores verbunden ist?

Softwarepakete zur Erkennung von Netzwerkmotiven können enorm hohe Z-Scores liefern (der höchste Wert, den ich gesehen habe, ist 600.000+, aber Z-Scores von mehr als 100 sind durchaus üblich). Ich habe vor zu zeigen, dass diese Z-Scores falsch sind. Riesige Z-Scores entsprechen extrem niedrigen zugehörigen Wahrscheinlichkeiten. Die Werte der zugehörigen Wahrscheinlichkeiten …

14 probability normal-distribution p-value approximation z-statistic

7

Ist es falsch, Ergebnisse als "fast" oder "etwas" signifikant zu bezeichnen?

Allgemeiner Konsens zu einer ähnlichen Frage: Ist es falsch, die Ergebnisse als "hoch signifikant" zu bezeichnen? ist, dass "hoch signifikant" eine gültige, wenn auch unspezifische Methode ist, um die Stärke einer Assoziation zu beschreiben, deren p-Wert weit unter Ihrer voreingestellten Signifikanzschwelle liegt. Wie sieht es jedoch mit der Beschreibung von …

13 hypothesis-testing statistical-significance p-value terminology

1

Helfen Sie mir, die

Ich versuche hier ein Bayesianisches Logit der Daten durchzuführen . Ich verwende bayesglm()in dem armPaket in R. Die Codierung ist einfach genug: df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T) library(arm) model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"), data=df) summary(model) gibt die folgende Ausgabe aus: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) …

13 r bayesian p-value

1

Was ist der Unterschied zwischen wilcox.test und coin :: wilcox_test in R?

Diese beiden Funktionen existieren in R, aber ich kenne ihre Unterschiede nicht. Es scheint, dass sie nur dieselben p-Werte zurückgeben, wenn sie wilcox.testmit correct=FALSEund wilcox_test(im Münzpaket) mit aufrufen distribution="aymptotic". Für andere Werte geben sie andere p-Werte zurück. Gibt außerdem wilcox.testimmer W = 0 für meinen Datensatz zurück, unabhängig von den …

13 r hypothesis-testing p-value wilcoxon-mann-whitney

3

Einfache lineare Regression, p-Werte und der AIC

Mir ist klar, dass dieses Thema schon einige Male vorgekommen ist , aber ich bin mir immer noch unsicher, wie ich meine Regressionsergebnisse am besten interpretieren kann. Ich habe einen sehr einfachen Datensatz, bestehend aus einer Spalte mit x-Werten und einer Spalte mit y-Werten , aufgeteilt in zwei Gruppen nach …

13 regression p-value least-squares aic

3

Warum ist eine hochpositive Kurtosis für Hypothesentests problematisch?

Ich habe gehört (leider kann kein Link zu einem Text angegeben werden, was mir gesagt wurde), dass eine hohe positive Kurtosis von Residuen für genaue Hypothesentests und Konfidenzintervalle problematisch sein kann (und daher Probleme mit statistischen Schlussfolgerungen). Ist das wahr und wenn ja, warum? Würde eine hohe positive Kurtosis von …

13 statistical-significance p-value assumptions kurtosis

1

Interpretation der logistischen Regressionsausgabe in R

Ich arbeite an einer multiplen logistischen Regression in R mit glm. Die Prädiktorvariablen sind kontinuierlich und kategorial. Ein Auszug aus der Zusammenfassung des Modells zeigt Folgendes: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 2.451e+00 2.439e+00 1.005 0.3150 Age 5.747e-02 3.466e-02 1.658 0.0973 . BMI -7.750e-02 7.090e-02 -1.093 0.2743 ... …

13 r logistic interpretation p-value

8

Wenn der p-Wert genau 1 (1.0000000) ist, wie hoch sollten die Konfidenzintervallgrenzen sein, damit die Nullhypothese wahr ist? [geschlossen]

Geschlossen . Diese Frage erfordert Details oder Klarheit . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Fügen Sie Details hinzu und klären Sie das Problem, indem Sie diesen Beitrag bearbeiten . Geschlossen vor 5 Monaten . Dies ist eine rein hypothetische Frage. Eine sehr verbreitete Aussage ist, …

12 confidence-interval p-value

2

Wie können die gewählten falsch-positiven / falsch-negativen Fehlerquoten und die zugrunde liegende Kostenquote konsequent gerechtfertigt werden?

Kontext Eine Gruppe von Sozialwissenschaftlern und Statistikern ( Benjamin et al., 2017 ) hat kürzlich vorgeschlagen, dass die typische falsch-positive Rate ( = 0,05), die als Schwelle für die Bestimmung der "statistischen Signifikanz" verwendet wird, an eine konservativere Schwelle angepasst werden muss ( = .005). Eine konkurrierende Gruppe von Sozialwissenschaftlern …

12 hypothesis-testing p-value power type-i-and-ii-errors

2

Ist es falsch, Features basierend auf dem p-Wert auszuwählen?

Es gibt mehrere Beiträge zum Auswählen von Features. Eine der Methoden beschreibt die Wichtigkeit von Merkmalen basierend auf t-Statistiken. In R, varImp(model)angewendet auf ein lineares Modell mit standardisierten Merkmalen, wird der Absolutwert der t-Statistik für jeden Modellparameter verwendet. Im Grunde genommen wählen wir ein Feature basierend auf seiner t-Statistik aus, …

12 regression p-value feature-selection

Als «p-value» getaggte Fragen