Keith Winstein,
EDIT: Zur Verdeutlichung beschreibt diese Antwort das Beispiel in Keith Winsteins Antwort auf den König mit dem grausamen Statistikspiel. Die Bayes'schen und die Frequent'schen Antworten verwenden beide die gleichen Informationen, dh, die Informationen über die Anzahl der fairen und unfairen Münzen werden bei der Erstellung der Intervalle ignoriert. Wenn diese Informationen nicht ignoriert werden, sollte der Frequentist die integrierte Beta-Binomial-Wahrscheinlichkeit als Stichprobenverteilung für die Erstellung des Konfidenzintervalls verwenden. In diesem Fall ist das Clopper-Pearson-Konfidenzintervall nicht angemessen und muss geändert werden. Eine ähnliche Anpassung sollte in der Bayes'schen Lösung erfolgen.
EDIT: Ich habe auch die erstmalige Verwendung des Cloppers Pearson Interval geklärt.
EDIT: leider ist mein alpha falsch herum und mein clopper pearson intervall ist falsch. Ich entschuldige mich in aller Bescheidenheit bei @whuber, der richtig darauf hingewiesen hat, mit dem ich jedoch anfänglich nicht einverstanden war und den ich ignorierte.
Das CI mit der Clopper Pearson-Methode ist sehr gut
Wenn Sie nur eine Beobachtung erhalten, kann das Clopper Pearson-Intervall analytisch ausgewertet werden. Angenommen, die Münze wird als "Erfolg" (Köpfe) angezeigt, und Sie müssen so wählen , dassθ
[Pr(Bi(1,θ)≥X)≥α2]∩[Pr(Bi(1,θ)≤X)≥α2]
Wenn diese Wahrscheinlichkeiten P r ( B i ( 1 , & thgr ; ) ≥ 1 ) = & thgr; und P r ( B i ( 1 , & thgr ; ) ≤ 1 ) = 1 , so impliziert der Clopper Pearson CI, dass & thgr ; ≥ & agr;X=1Pr(Bi(1,θ)≥1)=θPr(Bi(1,θ)≤1)=1 (und die trivial immer wahr1≥αθ≥α2 ) wennX=1. WennX=0 sinddiese WahrscheinlichkeitenPr(Bi(1,θ)≥0)=1undPr(Bi(1,θ)≤0)=1-θ, so impliziert der Clopper Pearson CI, dass1-θ≥α1≥α2X=1X=0Pr(Bi(1,θ)≥0)=1Pr(Bi(1,θ)≤0)=1−θ oderθ≤1-α1−θ≥α2 wennX=0. Für einen 95% -KI erhalten wir also[0,025,1],wennX=1, und[0,0,975],wennX=0.θ≤1−α2X=0[0.025,1]X=1[ 0 , 0.975 ]X= 0
Daher wird jemand , der das Clopper Pearson-Konfidenzintervall verwendet, niemals enthauptet. Bei Einhaltung des Intervalls handelt es sich im Wesentlichen um den gesamten Parameterraum. Aber das CP-Intervall tut dies, indem es ein vermeintliches 95% -Intervall zu 100% abdeckt! Grundsätzlich "betrügt" der Frequentist, indem er ein 95% iges Konfidenzintervall überdeckt, das über das er / sie hinausgeht (obwohl wer in einer solchen Situation nicht betrügt? Wenn ich es wäre, würde ich das ganze [0, 1] Intervall). Wenn der König nach einem genauen 95% -KI fragen würde, würde diese Methode der Frequentisten ungeachtet dessen, was tatsächlich passiert ist, scheitern (vielleicht gibt es eine bessere?).
Was ist mit dem Bayes'schen Intervall? (insbesondere das Bayes'sche Intervall der höchsten posterioren Desnität (HPD))
Da wir a priori wissen, dass sowohl Kopf als auch Zahl auftreten können, ist der einheitliche Prior eine vernünftige Wahl. Daraus ergibt sich eine posteriore Verteilung von . Jetzt müssen wir nur noch ein Intervall mit 95% posteriorer Wahrscheinlichkeit erstellen. Ähnlich wie beim Clopper Pearson CI ist auch hier die kumulative Beta-Verteilung analytisch, so dass P r ( θ ≥ θ e | x = 1 ) = 1 -(θ|X)∼Beta(1+X,2−X) und P r ( & thgr ; ≤ & thgr ; e | x = 0 ) = 1 - ( 1 - & thgr; e ) 2 Setzen dieser Werte auf 0,95 ergibt & thgr ; e = √Pr(θ≥θe|x=1)=1−(θe)2Pr(θ≤θe| x=0)=1−(1−θe)2wennX=1und&thgr; e =1- √θe= 0,05----√≤ 0,224X= 1wennX=0. Die beiden glaubwürdigen Intervalle sind also(0,0,776)beiX=0und(0,224,1)beiX=1θe= 1 - 0,05----√≈ 0.776X= 0( 0 , 0,776 )X= 0( 0,224 , 1 )X= 1
Somit wird der Bayesianer für sein HPD-glaubwürdiges Intervall enthauptet, wenn er die schlechte Münze erhält und die schlechte Münze einen Endpunkt erreicht, der mit einer Chance von 1 auftritt.11012+ 1× 110≈ 0
Erstens ist das Bayes'sche Intervall kleiner als das Konfidenzintervall. Eine andere Sache ist, dass der Bayesianer zu 95% näher an der tatsächlich angegebenen Abdeckung wäre als der Frequentist. Tatsächlich ist der Bayesianer der Abdeckung von 95% so nahe, wie es bei diesem Problem möglich ist. Und im Gegensatz zu Keith 'Aussage verlieren 10 von 100 Bayesianern im Durchschnitt ihren Kopf, wenn die schlechte Münze ausgewählt wird (nicht alle, weil die schlechte Münze in dem Intervall, in dem sie nicht enthält, einen Kopf haben muss ). 0,1
0,0250,975
Um ein echtes 95% -Konfidenzintervall anzugeben, sollten per Definition einige Fälle (dh mindestens einer) des beobachteten Intervalls vorliegen , die nicht den wahren Wert des Parameters enthalten . Wie kann man sonst das 95% -Tag rechtfertigen? Wäre es nicht nur gültig oder ungültig, ein 90% -, 50% -, 20% - oder gar 0% -Intervall zu nennen?
Ich verstehe nicht, wie einfach die Angabe "es bedeutet 95% oder mehr" ohne eine ergänzende Einschränkung zufriedenstellend ist. Dies liegt daran, dass die offensichtliche mathematische Lösung der gesamte Parameterraum ist und das Problem trivial ist. Angenommen, ich möchte einen CI von 50%? Wenn nur die falsch-negativen Werte begrenzt werden, ist der gesamte Parameterraum ein gültiges CI, das nur diese Kriterien verwendet.
100%X= 0100 × 1012+ 9101012+ 1% > 95%X= 1
Abschließend erscheint es etwas seltsam, nach einem Unsicherheitsintervall zu fragen und dieses Intervall dann unter Verwendung des wahren Wertes zu bewerten, über den wir unsicher waren. Ein "gerechterer" Vergleich, sowohl für vertrauenswürdige als auch für glaubwürdige Intervalle, scheint mir die Wahrheit der mit dem Intervall gegebenen Aussage der Unsicherheit zu sein .