Ich weiß, dass es viele Materialien gibt, die den p-Wert erklären. Das Konzept ist jedoch ohne weitere Klarstellung nicht leicht festzuhalten.
Hier ist die Definition von p-Wert aus Wikipedia:
Der p-Wert ist die Wahrscheinlichkeit, eine Teststatistik zu erhalten, die mindestens so extrem ist wie die tatsächlich beobachtete, unter der Annahme, dass die Nullhypothese wahr ist. ( http://en.wikipedia.org/wiki/P-value )
Meine erste Frage betrifft den Ausdruck "mindestens so extrem wie die tatsächlich beobachtete". Mein Verständnis der Logik, die der Verwendung des p-Werts zugrunde liegt, ist wie folgt: Wenn der p-Wert klein ist, ist es unwahrscheinlich, dass die Beobachtung unter der Annahme der Nullhypothese erfolgte, und wir benötigen möglicherweise eine alternative Hypothese, um die Beobachtung zu erklären. Wenn der p-Wert nicht so klein ist, ist es wahrscheinlich, dass die Beobachtung nur unter der Annahme der Nullhypothese erfolgte und die Alternativhypothese zur Erklärung der Beobachtung nicht erforderlich ist. Wenn jemand also auf einer Hypothese bestehen will, muss er / sie zeigen, dass der p-Wert der Nullhypothese sehr klein ist. Unter diesem Gesichtspunkt verstehe ich den mehrdeutigen Ausdruck so, dass der p-Wert, wenn das PDF der Statistik unimodal ist, wobei die Teststatistik und der Wert ist, der sich aus der Beobachtung ergibt. Ist das richtig? Wenn es richtig ist, kann das bimodale PDF der Statistik trotzdem verwendet werden? Wenn zwei Peaks der PDF gut getrennt sind und der beobachtete Wert irgendwo im Bereich niedriger Wahrscheinlichkeitsdichte zwischen den beiden Peaks liegt, welches Intervall gibt der p-Wert die Wahrscheinlichkeit von?
Die zweite Frage betrifft eine andere Definition des p-Werts von Wolfram MathWorld:
Die Wahrscheinlichkeit, dass eine Variable zufällig einen Wert annimmt, der größer oder gleich dem beobachteten Wert ist. ( http://mathworld.wolfram.com/P-Value.html )
Ich habe verstanden, dass der Ausdruck "rein zufällig" als "Annahme einer Nullhypothese" interpretiert werden sollte. Ist das richtig?
Die dritte Frage betrifft die Verwendung der "Nullhypothese". Nehmen wir an, jemand möchte darauf bestehen, dass eine Münze fair ist. Er drückt die Hypothese aus, dass die relative Häufigkeit der Köpfe 0,5 beträgt. Dann lautet die Nullhypothese "relative Häufigkeit der Köpfe nicht 0,5". In diesem Fall ist die Berechnung des p-Werts der Nullhypothese schwierig, während die Berechnung für die alternative Hypothese einfach ist. Natürlich kann das Problem gelöst werden, indem die Rolle der beiden Hypothesen vertauscht wird. Meine Frage ist, ob eine Ablehnung oder Annahme, die direkt auf dem p-Wert der ursprünglichen alternativen Hypothese basiert (ohne die Nullhypothese einzuführen), in Ordnung ist oder nicht. Wenn es nicht in Ordnung ist, was ist die übliche Problemumgehung für solche Schwierigkeiten bei der Berechnung des p-Werts einer Nullhypothese?
Ich habe eine neue Frage gestellt , die anhand der Diskussion in diesem Thread klarer wird.