Kurz gesagt, Birnbaum argumentiert, dass zwei allgemein anerkannte Prinzipien logischerweise implizieren, dass das Wahrscheinlichkeitsprinzip gelten muss. Das Gegenargument von Mayo ist, dass der Beweis falsch ist, weil Birnbaum eines der Prinzipien missbraucht.
Im Folgenden vereinfache ich die Argumente, soweit sie nicht sehr streng sind. Mein Ziel ist es, sie einem breiteren Publikum zugänglich zu machen, da die ursprünglichen Argumente sehr technisch sind. Interessierte Leser sollten die Details in den Artikeln sehen, die in der Frage und in den Kommentaren verlinkt sind.
Aus Gründen der Anschaulichkeit, werde ich mit unbekanntem Bias auf dem Fall eine Münze konzentrieren . In Experiment drehen wir es 10 Mal um. In VersuchθE1E2 drehen wir es um, bis wir 3 "Schwänze" erhalten. Im Experiment Emix werfen wir eine faire Münze mit den Bezeichnungen "1" und "2": Wenn sie eine "1" ergibt, führen wir E1 ; wenn es eine "2" landet, führen wir E2 . Dieses Beispiel vereinfacht die Diskussion erheblich und zeigt die Logik der Argumente (die ursprünglichen Beweise sind natürlich allgemeiner).
Die Grundsätze:
Die folgenden zwei Prinzipien sind weit verbreitet:
Die schwache Konditionalitätsprinzip sagt , dass wir die gleichen Schlüsse ziehen sollten , wenn wir Experiment entscheiden auszuführen E1 , oder , wenn wir entscheiden , ausführen Emix und die Münze landet „1“.
Das Suffizienzprinzip besagt, dass wir in zwei Experimenten, bei denen eine ausreichende Statistik den gleichen Wert hat, die gleichen Schlussfolgerungen ziehen sollten.
Das folgende Prinzip wird von Bayesianern akzeptiert, aber nicht von Frequentisten. Dennoch behauptet Birnbaum, dass es eine logische Konsequenz der ersten beiden ist.
Das Likelihood-Prinzip besagt, dass wir in zwei Experimenten, in denen die Likelihood-Funktionen proportional sind, die gleichen Schlussfolgerungen ziehen sollten.
Birnbaums Satz:
Angenommen, wir führen E1 und erhalten 7 "Köpfe" aus zehn Flips. Die Wahrscheinlichkeitsfunktion von θ ist . Wir führen und werfen die Münze 10 Mal um, um 3 "Schwänze" zu erhalten. Die Wahrscheinlichkeitsfunktion von ist . Die beiden Wahrscheinlichkeitsfunktionen sind proportional.(103)θ7(1−θ)3E2θ(97)θ7(1−θ)3
Birnbaum betrachtet die folgende Statistik zu von bis :
wobei und die Anzahl der "Heads" bzw. "Tails" sind. Egal was passiert, meldet das Ergebnis so, als ob es aus Experiment stamme . Es stellt sich heraus, dass für in ausreicht . Der einzige Fall, der nicht trivial ist, ist, wenn und , wo wir habenEmix{1,2}×N2{1,2}×N2T:(ξ,x,y)→(1,x,y),
xyTE1TθEmixx=7y=3
P(Xmix=(1,x,y)|T=(1,x,y))=0.5×(103)θ7(1−θ)30.5×(103)θ7(1−θ)3+0.5×(97)θ7(1−θ)3=(103)(103)+(97).
Alle anderen Fälle sind 0 oder 1 - außer , was das Komplement der obigen Wahrscheinlichkeit ist. Die Verteilung von gegebenem ist unabhängig von ;, so dass eine ausreichende Statistik für .P(Xmix=(2,x,y)|T=(1,x,y))XmixTθTθ
Nun müssen wir nach dem Suffizienzprinzip dasselbe für und in , und nach dem Prinzip der schwachen Kondionalität müssen wir dasselbe für in und in sowie für in und in . Daher muss unsere Schlussfolgerung in allen Fällen dieselbe sein. Dies ist das Wahrscheinlichkeitsprinzip.(1,x,y)(2,x,y)Emix(x,y)E1(1,x,y)Emix(x,y)E2(2,x,y)Emix
Mayos Gegenbeweis:
Der Aufbau von Birnbaum ist kein Mischungsexperiment, da das Ergebnis der mit "1" und "2" bezeichneten Münze nicht beobachtet wurde , weshalb das Prinzip der schwachen Konditionalität für diesen Fall nicht gilt .
Nehmen Sie den Test gegen und ziehen Sie eine Schlussfolgerung aus dem p-Wert des Tests. Als vorläufige Beobachtung ist zu beachten, dass der p-Wert von in durch die Binomialverteilung als ungefähr ; Der p-Wert von in wird durch die negative Binomialverteilung mit ungefähr .θ=0.5θ>0.5(7,3)E10.1719(7,3)E20.0898
Hier kommt der wichtige Teil: Der p-Wert von in wird als Durchschnitt der beiden angegeben - denken Sie daran, dass wir den Status der Münze nicht kennen - dh ungefähr . Der p-Wert von in - wo die Münze beobachtet wird - ist jedoch der gleiche wie der in , dh ungefähr . Das Prinzip der schwachen Konditionalität gilt (die Schlussfolgerung ist dieselbe in und in wo die Münze "1" landet), und das Wahrscheinlichkeitsprinzip nicht. Das Gegenbeispiel widerlegt den Satz von Birnbaum.T=(1,7,3)Emix0.1309(1,7,3)EmixE10.1719E1Emix
Peña und Berger widerlegen Mayos Gegenbeweis:
Mayo änderte implizit die Aussage des Suffizienzprinzips: Sie interpretiert "gleiche Schlussfolgerungen" als "gleiche Methode". Die Ermittlung des p-Wertes ist eine Inferenzmethode, jedoch keine Schlussfolgerung.
Das Zulänglichkeit Prinzip besagt , dass , wenn es eine ausreichende Statistik existiert, dann die Schlussfolgerungen gleich sein müssen, aber es erfordert nicht die erschöpfende Statistik überhaupt verwendet werden. Wenn dies der Fall wäre, würde dies zu einem Widerspruch führen, wie Mayo gezeigt hat.