Ich denke, es ist eine Kombination von allem, was bereits gesagt wurde. Dies sind sehr interessante Daten, und ich habe bisher nicht daran gedacht, solche p-Wert-Verteilungen zu betrachten. Wenn die Nullhypothese wahr ist, wäre der p-Wert einheitlich. Aber natürlich würden wir bei veröffentlichten Ergebnissen aus vielen Gründen keine Einheitlichkeit sehen.
Wir machen die Studie, weil wir erwarten, dass die Nullhypothese falsch ist. Wir sollten also öfter signifikante Ergebnisse erzielen als nicht.
Wenn die Nullhypothese nur die halbe Zeit falsch wäre, würden wir keine gleichmäßige Verteilung der p-Werte erhalten.
Problem mit der Aktenschublade: Wie bereits erwähnt, hätten wir Angst, das Papier einzureichen, wenn der p-Wert nicht signifikant ist, z. B. unter 0,05.
Die Verlage lehnen das Papier aufgrund nicht signifikanter Ergebnisse ab, obwohl wir uns entschieden haben, es einzureichen.
Wenn die Ergebnisse an der Grenze liegen, werden wir (möglicherweise nicht in böswilliger Absicht) Maßnahmen ergreifen, um die Bedeutung zu ermitteln. (a) Runden Sie auf 0,05 ab, wenn der p-Wert 0,053 beträgt. (b) Finden Sie Beobachtungen, von denen wir glauben, dass sie Ausreißer sind, und nachdem Sie sie entfernt haben, fällt der p-Wert unter 0,05 ab.
Ich hoffe, dies fasst alles, was gesagt wurde, auf einigermaßen verständliche Weise zusammen.
Was ich für interessant halte, ist, dass wir p-Werte zwischen 0,05 und 0,1 sehen. Wenn Veröffentlichungsregeln etwas mit p-Werten über 0,05 ablehnen würden, würde der rechte Schwanz bei 0,05 abgeschnitten. Hat es tatsächlich bei 0,10 abgeschnitten? In diesem Fall akzeptieren möglicherweise einige Autoren und Zeitschriften ein Signifikanzniveau von 0,10, jedoch nichts Höheres.
Da viele Papiere mehrere p-Werte enthalten (angepasst an die Multiplizität oder nicht) und das Papier akzeptiert wird, weil die Schlüsseltests signifikant waren, werden möglicherweise nicht signifikante p-Werte in der Liste aufgeführt. Dies wirft die Frage auf, ob alle angegebenen p-Werte in der Arbeit im Histogramm enthalten sind.
Eine weitere Beobachtung ist, dass die Häufigkeit veröffentlichter Arbeiten deutlich zunimmt, da der p-Wert weit unter 0,05 sinkt. Vielleicht ist das ein Hinweis darauf, dass Autoren das p-Wert-Denken überinterpretieren, dass p <0,0001 viel publikationswürdiger ist. Ich denke, der Autor ignoriert oder merkt nicht, dass der p-Wert genauso stark von der Sample-Größe abhängt wie von der Größe der Effektgröße.