Der folgende Auszug stammt aus dem Beitrag: Was sind die Unterschiede zwischen einseitigen und zweiseitigen Tests? , auf der Statistik-Hilfeseite der UCLA.
... überlegen Sie, welche Konsequenzen das Ausbleiben eines Effekts in die andere Richtung hat. Stellen Sie sich vor, Sie haben ein neues Medikament entwickelt, von dem Sie glauben, dass es eine Verbesserung gegenüber einem vorhandenen Medikament darstellt. Sie möchten Ihre Fähigkeit maximieren, die Verbesserung zu erkennen, und entscheiden sich für einen einseitigen Test. Dabei wird nicht geprüft, ob das neue Medikament möglicherweise weniger wirksam ist als das vorhandene.
Nachdem ich die absoluten Grundlagen des Hypothesentests erlernt und mich mit einem Test gegen zwei Tests befasst habe, verstehe ich die grundlegende Mathematik und die verbesserte Erkennungsfähigkeit von Tests mit einem Schwanz usw. Aber ich kann mich einfach nicht um meinen Kopf wickeln um eine Sache ... Was ist der Sinn? Ich verstehe wirklich nicht, warum Sie Ihr Alpha zwischen den beiden Extremen aufteilen sollten, wenn Ihr Sample-Ergebnis nur in der einen oder der anderen oder in keiner sein kann.
Nehmen Sie das Beispielszenario aus dem oben zitierten Text. Wie könnten Sie möglicherweise "nicht testen", um ein Ergebnis in die entgegengesetzte Richtung zu erhalten? Sie haben Ihren Stichprobenmittelwert. Sie haben Ihre Bevölkerung bedeuten. Einfache Arithmetik sagt Ihnen, was höher ist. Was gibt es in die entgegengesetzte Richtung zu testen oder nicht zu testen? Was hält Sie davon ab, mit der entgegengesetzten Hypothese von vorne anzufangen, wenn Sie deutlich sehen, dass der Stichprobenmittelwert in die andere Richtung abweicht?
Ein weiteres Zitat von derselben Seite:
Die Auswahl eines einseitigen Tests nach dem Ausführen eines zweiseitigen Tests, bei dem die Nullhypothese nicht verworfen wurde, ist nicht angemessen, auch wenn der zweiseitige Test nahezu signifikant war.
Ich gehe davon aus, dass dies auch für das Umschalten der Polarität Ihres einseitigen Tests gilt. Aber wie ist dieses "behandelte" Ergebnis weniger gültig, als wenn Sie einfach den richtigen einseitigen Test gewählt hätten?
Klar, ich vermisse hier einen großen Teil des Bildes. Alles scheint einfach zu willkürlich. Was es ist, denke ich, in dem Sinne, dass das, was "statistisch signifikant" bedeutet - 95%, 99%, 99,9% ..., zunächst willkürlich ist.