Es gibt zwei Versuche, genau das zu tun, was Sie in der statistischen Geschichte gesagt haben, den Bayesian und den Fiducial. RA Fisher gründete zwei Schulen für statistisches Denken, die Likelihoodist-Schule, die auf der Methode der maximalen Wahrscheinlichkeit basiert, und die Fiducial-Schule, die scheiterte, aber versucht, genau das zu tun, was Sie wollen.
Die kurze Antwort, warum es fehlgeschlagen ist, ist, dass sich seine Wahrscheinlichkeitsverteilungen nicht in die Einheit integriert haben. Die Lektion war am Ende, dass die vorherige Wahrscheinlichkeit eine notwendige Sache ist, um das zu erschaffen, was Sie erschaffen wollen. In der Tat gehen Sie den Weg eines der größten Statistiker der Geschichte, und mehr als einige der anderen Größen starben in der Hoffnung auf eine Lösung dieses Problems. Wenn es gefunden würde, würde es Nullhypothesenmethoden in Bezug auf die Arten von Problemen, die sie lösen könnten, mit Bayes'schen Methoden gleichsetzen. In der Tat würde es an Bayes vorbeischieben, es sei denn, es gab echte Vorinformationen.
Sie sollten auch vorsichtig mit Ihrer Aussage sein, dass ein p-Wert eine höhere Wahrscheinlichkeit für die Alternative anzeigt. Das gilt nur für die Fisherian Likelihoodist School. In der Pearson-Neyman Frequentist School ist das überhaupt nicht wahr. Ihre Wette unten scheint eine Pearson-Neyman-Wette zu sein, während Ihr p-Wert nicht kompatibel ist, da er von der Fischerschule stammt.
Um gemeinnützig zu sein, gehe ich davon aus, dass in Ihrem Beispiel keine Publikationsverzerrung vorliegt und daher nur signifikante Ergebnisse in Zeitschriften erscheinen, die eine hohe Rate falscher Entdeckungen verursachen. Ich behandle dies als Zufallsstichprobe aller durchgeführten Studien, unabhängig von den Ergebnissen. Ich würde argumentieren, dass Ihre Wettquoten im klassischen Sinne von de Finetti nicht kohärent wären.
In de Finettis Welt ist eine Wette kohärent, wenn der Buchmacher nicht von Spielern gespielt werden kann, so dass sie einen sicheren Verlust erleiden. In der einfachsten Konstruktion ist es wie die Lösung für das Problem des Schneidens des Kuchens. Eine Person schneidet das Stück in zwei Hälften, die andere Person wählt das gewünschte Stück aus. Bei dieser Konstruktion würde eine Person die Preise für die Wetten für jede Hypothese angeben, aber die andere Person würde die Wette entweder kaufen oder verkaufen. Im Wesentlichen könnten Sie die Null leerverkaufen. Um optimal zu sein, müssten die Chancen streng fair sein. P-Werte führen nicht zu fairen Gewinnchancen.
Um dies zu veranschaulichen, betrachten Sie die Studie von Wetzels et al. Unter http://ejwagenmakers.com/2011/WetzelsEtAl2011_855.pdf
Das Zitat dafür ist: Ruud Wetzels, Dora Matzke, Michael D. Lee, Jeffrey N. Rounder, Geoffrey J. Iverson und Eric-Jan Wagenmakers. Statistische Evidenz in der experimentellen Psychologie: Ein empirischer Vergleich mit 855 t-Tests. Perspektiven der Psychologie. 6 (3) 291-298. 2011
Dies ist ein direkter Vergleich von 855 veröffentlichten t-Tests unter Verwendung von Bayes-Faktoren, um das Problem der vorherigen Verteilung zu umgehen. In 70% der p-Werte zwischen 0,05 und 0,01 waren die Bayes-Faktoren bestenfalls anekdotisch. Dies liegt an der mathematischen Form, mit der Frequentisten das Problem lösen.
Nullhypothesenmethoden setzen voraus, dass das Modell wahr ist, und verwenden aufgrund ihrer Konstruktion eher eine statistische Minimax-Verteilung als eine Wahrscheinlichkeitsverteilung. Beide Faktoren wirken sich auf Unterschiede zwischen Bayes'schen und nicht-Bayes'schen Lösungen aus. Stellen Sie sich eine Studie vor, in der die Bayes'sche Methode die hintere Wahrscheinlichkeit einer Hypothese mit drei Prozent bewertet. Stellen Sie sich vor, der p-Wert liegt unter fünf Prozent. Beides trifft zu, da drei Prozent weniger als fünf Prozent sind. Trotzdem ist der p-Wert keine Wahrscheinlichkeit. Es gibt nur den Maximalwert an, der die Wahrscheinlichkeit sein kann, die Daten zu sehen, nicht die tatsächliche Wahrscheinlichkeit, dass eine Hypothese wahr oder falsch ist. In der Tat können Sie bei der p-Wert-Konstruktion nicht zwischen zufälligen Effekten mit einer wahren Null und einer falschen Null mit guten Daten unterscheiden.
Wenn Sie sich die Wetzel-Studie ansehen, werden Sie feststellen, dass es sehr offensichtlich ist, dass die durch die p-Werte implizierten Quoten nicht mit den durch das Bayes'sche Maß implizierten Quoten übereinstimmen. Da das Bayes'sche Maß sowohl zulässig als auch kohärent ist und das nicht-Bayes'sche nicht kohärent ist, ist es nicht sicher, die Abbildung der p-Werte auf die wahren Wahrscheinlichkeiten anzunehmen. Die erzwungene Annahme, dass die Null gültig ist, liefert gute Abdeckungswahrscheinlichkeiten, erzeugt jedoch keine guten Spielwahrscheinlichkeiten.
Um ein besseres Gefühl dafür zu bekommen, warum, betrachten Sie Cox 'erstes Axiom, dass die Plausibilität einer Hypothese durch eine reelle Zahl beschrieben werden kann. Dies bedeutet implizit, dass alle Hypothesen eine reelle Zahl haben, die an ihre Plausibilität gebunden ist. Bei Nullhypothesenmethoden hat nur die Null eine reelle Zahl, die an ihre Plausibilität gebunden ist. Die alternative Hypothese hat keine Messung durchgeführt und ist sicherlich nicht die Ergänzung zur Wahrscheinlichkeit, die Daten zu beobachten, vorausgesetzt, die Null ist wahr. In der Tat, wenn die Null wahr ist, dann ist das Komplement durch Annahme ohne Rücksicht auf die Daten falsch.
Wenn Sie die Wahrscheinlichkeiten mit p-Werten als Grundlage für Ihre Messung konstruieren würden, wäre der Bayes'sche mit Bayes'schen Messungen immer in der Lage, einen Vorteil gegenüber Ihnen zu erzielen. Wenn der Bayesianer die Gewinnchancen festlegen würde, würde die Entscheidungstheorie von Pearson und Neyman eine Erklärung über die Wette liefern oder nicht wetten, aber sie könnten den zu wettenden Betrag nicht definieren. Da die Bayes'schen Gewinnchancen fair waren, wäre der erwartete Gewinn aus der Anwendung der Pearson- und Neyman-Methode Null.
In der Tat ist die Wetzel-Studie genau das, wovon Sie sprechen, aber mit 145 weniger Wetten. Wenn Sie sich Tabelle drei ansehen, werden Sie einige Studien sehen, in denen der Frequentist die Null ablehnt, der Bayesianer jedoch feststellt, dass die Wahrscheinlichkeit die Null bevorzugt.