Ein p-Wert ist die Wahrscheinlichkeit, eine Statistik zu erhalten, die mindestens so extrem ist wie die in den Probendaten beobachtete, wenn angenommen wird, dass die Nullhypothese ( ) wahr ist.
Grafisch entspricht dies dem Bereich, der durch die Stichprobenstatistik unter der Stichprobenverteilung definiert ist, die man erhalten würde, wenn man annimmt :
Da die Form dieser angenommenen Verteilung jedoch tatsächlich auf den Beispieldaten basiert, erscheint es mir eine seltsame Wahl , sie auf zentrieren .
Wenn man stattdessen die Stichprobenverteilung der Statistik verwenden würde, dh die Verteilung auf der Stichprobenstatistik zentrieren würde, würde das Testen von Hypothesen der Schätzung der Wahrscheinlichkeit von bei den Stichproben entsprechen.μ 0
In diesem Fall ist der p-Wert die Wahrscheinlichkeit, eine Statistik zu erhalten, die mindestens so extrem ist wie wenn die Daten anstelle der obigen Definition verwendet werden.
Zusätzlich hat eine solche Interpretation den Vorteil, dass sie sich gut auf das Konzept der Konfidenzintervalle bezieht:
Ein Hypothesentest mit dem Signifikanzniveau wäre gleichbedeutend mit der Überprüfung, ob innerhalb des -Konfidenzintervalls der Stichprobenverteilung liegt.μ 0 ( 1 - α )
Ich bin daher der Meinung, dass das Zentrieren der Verteilung auf eine unnötige Komplikation sein könnte.
Gibt es wichtige Gründe für diesen Schritt, die ich nicht berücksichtigt habe?


