Als «p-value» getaggte Fragen

Bei häufig auftretenden Hypothesentests wird die p-Wert ist die Wahrscheinlichkeit, dass ein Ergebnis extrem (oder höher) als das beobachtete Ergebnis ist, unter der Annahme, dass die Nullhypothese wahr ist.

2
Palantirs asiatischer Diskriminierungsfall: Wie wurden die Wahrscheinlichkeiten berechnet?
Ich habe diesen Artikel über Palantirs Fall gelesen, in dem die Abteilung für Arbeit sie beschuldigt, Asiaten diskriminiert zu haben. Weiß jemand, woher diese Wahrscheinlichkeitsschätzungen stammen? Ich erhalte nicht 1/741 in Punkt (a). (a) Für die Position als QA-Ingenieur stellte Palantir aus einem Pool von mehr als 730 qualifizierten Bewerbern …

3
Ist p = 5,0% signifikant?
Heute wurde ich gefragt, ob ein p-Wert von 0,05 (genau) als signifikant angesehen wird (gegebenes Alpha = 5%) oder nicht. Ich kannte die Antwort nicht und Google stellte beide Antworten auf: (a) Das Ergebnis ist signifikant, wenn p weniger als 5% und (b) wenn p weniger als 5% oder gleich …


2
Berechnung des p-Wertes aus einer beliebigen Verteilung
Ich hoffe, das ist keine dumme Frage. Nehmen wir an, ich habe eine willkürliche kontinuierliche Verteilung. Ich habe auch eine Statistik und möchte diese beliebige Verteilung verwenden, um einen p-Wert für diese Statistik zu erhalten. Mir ist klar, dass es in R einfach ist, dies zu tun, solange Ihre Distribution …

2
Wie lautet die Formel für den Benjamini-Hochberg-bereinigten p-Wert?
Ich verstehe das Verfahren und was es steuert. Wie lautet also die Formel für den angepassten p-Wert in der BH-Prozedur für Mehrfachvergleiche? In diesem Moment wurde mir klar, dass das ursprüngliche BH keine angepassten p-Werte produziert, sondern nur die (nicht-) Ablehnungsbedingung angepasst hat: https://www.jstor.org/stable/2346101 . Gordon Smyth hat 2002 ohnehin …

3
Wie berechnet man die Wahrscheinlichkeit, die mit absurd großen Z-Scores verbunden ist?
Softwarepakete zur Erkennung von Netzwerkmotiven können enorm hohe Z-Scores liefern (der höchste Wert, den ich gesehen habe, ist 600.000+, aber Z-Scores von mehr als 100 sind durchaus üblich). Ich habe vor zu zeigen, dass diese Z-Scores falsch sind. Riesige Z-Scores entsprechen extrem niedrigen zugehörigen Wahrscheinlichkeiten. Die Werte der zugehörigen Wahrscheinlichkeiten …

7
Ist es falsch, Ergebnisse als "fast" oder "etwas" signifikant zu bezeichnen?
Allgemeiner Konsens zu einer ähnlichen Frage: Ist es falsch, die Ergebnisse als "hoch signifikant" zu bezeichnen? ist, dass "hoch signifikant" eine gültige, wenn auch unspezifische Methode ist, um die Stärke einer Assoziation zu beschreiben, deren p-Wert weit unter Ihrer voreingestellten Signifikanzschwelle liegt. Wie sieht es jedoch mit der Beschreibung von …

1
Helfen Sie mir, die
Ich versuche hier ein Bayesianisches Logit der Daten durchzuführen . Ich verwende bayesglm()in dem armPaket in R. Die Codierung ist einfach genug: df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T) library(arm) model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"), data=df) summary(model) gibt die folgende Ausgabe aus: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) …
13 r  bayesian  p-value 

1
Was ist der Unterschied zwischen wilcox.test und coin :: wilcox_test in R?
Diese beiden Funktionen existieren in R, aber ich kenne ihre Unterschiede nicht. Es scheint, dass sie nur dieselben p-Werte zurückgeben, wenn sie wilcox.testmit correct=FALSEund wilcox_test(im Münzpaket) mit aufrufen distribution="aymptotic". Für andere Werte geben sie andere p-Werte zurück. Gibt außerdem wilcox.testimmer W = 0 für meinen Datensatz zurück, unabhängig von den …

3
Einfache lineare Regression, p-Werte und der AIC
Mir ist klar, dass dieses Thema schon einige Male vorgekommen ist , aber ich bin mir immer noch unsicher, wie ich meine Regressionsergebnisse am besten interpretieren kann. Ich habe einen sehr einfachen Datensatz, bestehend aus einer Spalte mit x-Werten und einer Spalte mit y-Werten , aufgeteilt in zwei Gruppen nach …


1
Interpretation der logistischen Regressionsausgabe in R
Ich arbeite an einer multiplen logistischen Regression in R mit glm. Die Prädiktorvariablen sind kontinuierlich und kategorial. Ein Auszug aus der Zusammenfassung des Modells zeigt Folgendes: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 2.451e+00 2.439e+00 1.005 0.3150 Age 5.747e-02 3.466e-02 1.658 0.0973 . BMI -7.750e-02 7.090e-02 -1.093 0.2743 ... …

8
Wenn der p-Wert genau 1 (1.0000000) ist, wie hoch sollten die Konfidenzintervallgrenzen sein, damit die Nullhypothese wahr ist? [geschlossen]
Geschlossen . Diese Frage erfordert Details oder Klarheit . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Fügen Sie Details hinzu und klären Sie das Problem, indem Sie diesen Beitrag bearbeiten . Geschlossen vor 5 Monaten . Dies ist eine rein hypothetische Frage. Eine sehr verbreitete Aussage ist, …

2
Wie können die gewählten falsch-positiven / falsch-negativen Fehlerquoten und die zugrunde liegende Kostenquote konsequent gerechtfertigt werden?
Kontext Eine Gruppe von Sozialwissenschaftlern und Statistikern ( Benjamin et al., 2017 ) hat kürzlich vorgeschlagen, dass die typische falsch-positive Rate ( = 0,05), die als Schwelle für die Bestimmung der "statistischen Signifikanz" verwendet wird, an eine konservativere Schwelle angepasst werden muss ( = .005). Eine konkurrierende Gruppe von Sozialwissenschaftlern …

2
Ist es falsch, Features basierend auf dem p-Wert auszuwählen?
Es gibt mehrere Beiträge zum Auswählen von Features. Eine der Methoden beschreibt die Wichtigkeit von Merkmalen basierend auf t-Statistiken. In R, varImp(model)angewendet auf ein lineares Modell mit standardisierten Merkmalen, wird der Absolutwert der t-Statistik für jeden Modellparameter verwendet. Im Grunde genommen wählen wir ein Feature basierend auf seiner t-Statistik aus, …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.