Betrachten Sie die Situation, in der Sie Beobachtungen eines binären Prozesses (2-coutcome) haben. Oft werden die beiden möglichen Ergebnisse jeder Studie als Erfolg und Misserfolg bezeichnet.n = 20
Häufiges Konfidenzintervall. Angenommen, Sie beobachten Erfolge in den Versuchen. Zeigen Sie die Anzahl der Erfolge als Zufallsvariable wobei die Erfolgswahrscheinlichkeit eine unbekannte Konstante ist. Das Wald 95% Frequentist-Konfidenzintervall basiert auf einer Schätzung von
Unter Verwendung einer normalen Näherung hat dieses CI die Form oder
[Der etwas verbesserte Agresti-Coull-
Stil von 95% CI beträgtx = 15n = 20X.X.∼ B i n o m ( n = 20 ; p ) ,pp^= 15 / 20 = 0,75 ,p .p^± 1,96p^( 1 -p^) / n- -- -- -- -- -- -- -- -- -√( 0,560 , 0,940 ) .( 0,526 , 0,890 ) . ]]
Eine übliche Interpretation ist, dass die Prozedur, die ein solches Intervall erzeugt, auf lange Sicht in 95% der Fälle untere und obere Konfidenzgrenzen erzeugt, die den wahren Wert von . [Der Vorteil des Agresti-Coull-Intervalls besteht darin, dass der langfristige Anteil solcher Einschlüsse näher an 95% liegt als beim Wald-Intervall.]p
Bayesianisches glaubwürdiges Intervall. Der Bayes'sche Ansatz beginnt mit der Behandlung von als Zufallsvariable. Vor dem Anzeigen von Daten können wir, wenn wir keine Erfahrung mit dem durchgeführten Binomialversuch oder keine persönliche Meinung zur Verteilung von die 'flache' oder 'nicht informative' Gleichverteilung wählen undpp ,p ∼ U n i f( 0 , 1 ) ≡ B e t a ( 1 , 1 ) .
Bei 15 Erfolgen in 20 Binomialversuchen finden wir dann die posteriore Verteilung von als Produkt der vorherigen Verteilung und der Binomialwahrscheinlichkeitsfunktion.p
f(p|x)∝p1−1(1−p)1−1×p15(1−p)5∝p16−1(1−p)6−1,
wobei das Symbol (gelesen 'proportional zu') anzeigt, dass wir 'normierende' konstante Faktoren der Verteilungen weglassen, die kein enthalten
Ohne den Normierungsfaktor wird eine Dichtefunktion oder PMF als "Kernel" der Verteilung bezeichnet.∝p.
Hier erkennen wir, dass der Kern der posterioren Verteilung der der DistributionDann wird ein 95% Bayes'sches posteriores Intervall oder ein glaubwürdiges Intervall gefunden, indem 2,5% von jedem Schwanz der posterioren Verteilung abgeschnitten werden. Hier ist das Ergebnis von R:
[Informationen zu Beta-Distributionen finden Sie in Wikipedia .]Beta(16,6).(0.528,0.887).
qbeta(c(.025,.975), 16, 6)
[1] 0.5283402 0.8871906
Wenn wir der Meinung sind, dass das Vorherige vernünftig ist und glauben, dass das Binomialversuch mit 20 Versuchen fair durchgeführt wurde, dann müssen wir logischerweise erwarten, dass die Bayes'sche Intervallschätzung nützliche Informationen über das vorliegende Experiment liefert - ohne Bezug auf eine hypothetische Langzeit- Zukunft laufen.
Beachten Sie, dass dieses Bayes'sche glaubwürdige Intervall dem Agresti-Coull-Konfidenzintervall numerisch ähnlich ist. Wie Sie jedoch betonen, sind die Interpretationen der beiden Arten von Intervallschätzungen (Frequentist und Bayesian) nicht identisch.
Informativ vor. Bevor wir die Daten sahen, hätten wir, wenn wir Grund zu der Annahme hatten, dassmöglicherweise die Verteilungals vorherige Verteilung gewählt. [Diese Verteilung hat einen Mittelwert von 2/3, eine Standardabweichung von etwa 0,35 und legt etwa 95% ihrer Wahrscheinlichkeit in das Intervall]]p≈2/3,Beta(8,4)(0.39,0.89).
qbeta(c(.025,.975), 8,4)
[1] 0.3902574 0.8907366
In diesem Fall ergibt das Multiplizieren des Prior mit der Wahrscheinlichkeit den hinteren Kern von
so dass das zu 95% Bayes'sche glaubwürdige Intervall beträgt
Die hintere Verteilung ist eine Verschmelzung der Informationen im Prior und der Wahrscheinlichkeit, die grob übereinstimmen, so dass die resultierende Bayes'sche Intervallschätzung kürzer ist als das Intervall vom flachen Prior.Beta(23,7),(0.603,0.897).
qbeta(c(.025,.975), 23,7)
[1] 0.6027531 0.8970164
Anmerkungen: (1) Die Beta-Prior- und Binomial-Likelihood-Funktion sind "konjugiert", dh mathematisch kompatibel, so dass wir die posteriore Verteilung ohne Berechnung finden können. Manchmal scheint es keine vorherige Verteilung zu geben, die mit der Wahrscheinlichkeit konjugiert ist. Dann kann es notwendig sein, eine numerische Integration zu verwenden, um die hintere Verteilung zu finden.
(2) Ein glaubwürdiges Bayes'sches Intervall von einem nicht informativen Prior hängt im Wesentlichen von der Wahrscheinlichkeitsfunktion ab. Außerdem hängt ein Großteil der häufig auftretenden Schlussfolgerungen von der Wahrscheinlichkeitsfunktion ab. Daher ist es keine Überraschung, dass ein Bayes'sches glaubwürdiges Intervall von einem flachen Prior numerisch einem frequentistischen Konfidenzintervall ähnlich sein kann, das auf derselben Wahrscheinlichkeit basiert.