Warum scheint dieses Ergebnis "falsch" zu sein? Ein Bayesianer würde sagen, dass das Ergebnis kontraintuitiv zu sein scheint, da wir "vorher" glauben, wann die Sonne explodieren wird, und die Beweise, die von dieser Maschine geliefert werden, nicht ausreichen, um diese Überzeugungen zu verwischen (hauptsächlich wegen der Unsicherheit aufgrund der Münzwurf). Aber ein Frequentist ist in der Lage, eine solche Einschätzung vorzunehmen, er muss dies einfach im Kontext von Daten tun, im Gegensatz zu Glauben.
Die wahre Quelle des Paradoxons ist die Tatsache, dass der durchgeführte frequentistische statistische Test nicht alle verfügbaren Daten berücksichtigt. Es gibt kein Problem mit der Analyse im Comic, aber das Ergebnis scheint merkwürdig, weil wir wissen, dass die Sonne höchstwahrscheinlich noch lange nicht explodieren wird. Aber woher wissen wir das? Weil wir Messungen, Beobachtungen und Simulationen durchgeführt haben, die einschränken können, wann die Sonne explodiert. Daher sollte unser gesamtes Wissen diese Messungen und Datenpunkte berücksichtigen.
In einer Bayes'schen Analyse wird dazu ein Prior mithilfe dieser Messungen erstellt (obwohl das Verfahren zum Umwandeln von Messungen in Prior nicht genau definiert ist: Irgendwann muss ein erster Prior vorhanden sein, sonst sind es "Turtles All" den Weg nach unten "). Wenn der Bayesianer also seinen Prior verwendet, berücksichtigt er wirklich eine Menge zusätzlicher Informationen, die in der p-Wert-Analyse des Frequentisten nicht enthalten sind.
Um also auf Augenhöhe zu bleiben, sollte eine vollständige frequentistische Analyse des Problems dieselben zusätzlichen Daten über die Sonnenexplosion enthalten, die zur Erstellung des Bayes'schen Prior verwendet werden. Anstatt jedoch Priors zu verwenden, würde ein Frequentist einfach die Wahrscheinlichkeit erhöhen, die er verwendet, um diese anderen Messungen einzubeziehen, und sein p-Wert würde unter Verwendung dieser vollen Wahrscheinlichkeit berechnet.
L=LL
Eine vollständige frequentistische Analyse würde höchstwahrscheinlich zeigen, dass der zweite Teil der Wahrscheinlichkeit viel einschränkender ist und den dominierenden Beitrag zur Berechnung des p-Werts leistet (da wir eine Fülle von Informationen über die Sonne und die Fehler in diesen Informationen haben) sind klein (hoffentlich)).
Praktisch muss man nicht alle Datenpunkte der letzten 500 Jahre sammeln, um eine häufigere Berechnung durchzuführen. Man kann sie als einen einfachen Wahrscheinlichkeitsausdruck bezeichnen, der die Unsicherheit darüber verschlüsselt, ob die Sonne explodiert ist oder nicht. Dies ähnelt dann dem Bayesianischen Prior, ist jedoch philosophisch etwas anders, da es eine Wahrscheinlichkeit ist, was bedeutet, dass es eine vorherige Messung codiert (im Gegensatz zu einem Prior, der eine a priori-Annahme codiert). Dieser neue Begriff wird ein Teil der Wahrscheinlichkeit und wird verwendet, um Konfidenzintervalle (oder p-Werte oder was auch immer) zu bilden, im Gegensatz zum Bayesianischen Prior, der integriert wird, um glaubwürdige Intervalle oder posteriore zu bilden.