Wie formalisiert man eine vorherige Wahrscheinlichkeitsverteilung? Gibt es Faustregeln oder Tipps, die man verwenden sollte?

Während ich gerne denke, dass ich das Konzept der Vorinformationen in der statistischen Analyse und Entscheidungsfindung von Bayes gut verstehe, habe ich oft Probleme, mich mit seiner Anwendung zu befassen. Ich denke an einige Situationen, die meine Kämpfe veranschaulichen, und ich habe das Gefühl, dass sie in den Bayes'schen statistischen Lehrbüchern, die ich bisher gelesen habe, nicht richtig angesprochen werden:

Nehmen wir an, ich habe vor einigen Jahren eine Umfrage durchgeführt, die besagt, dass 68% der Menschen am Kauf eines ACME-Produkts interessiert wären. Ich beschließe, die Umfrage erneut durchzuführen. Während ich die gleiche Stichprobengröße wie beim letzten Mal verwenden werde (z. B. n = 400), haben sich die Meinungen der Leute wahrscheinlich seitdem geändert. Wenn ich jedoch als Vorgänger eine Beta-Distribution verwende, in der 272 von 400 Befragten mit "Ja" geantwortet haben, würde ich der Umfrage, die ich vor einigen Jahren durchgeführt habe, und der Umfrage, die ich jetzt durchführen würde, das gleiche Gewicht beimessen. Gibt es eine Faustregel, um die größere Unsicherheit festzustellen, die ich aufgrund der Tatsache, dass diese Daten einige Jahre alt sind, auf den Prior setzen möchte? Ich verstehe, dass ich den Prior von 272/400 auf beispielsweise 136/200 reduzieren kann, aber das fühlt sich äußerst willkürlich an, und ich frage mich, ob es irgendeine Form von Rechtfertigung gibt, vielleicht in der Literatur.

Nehmen wir als weiteres Beispiel an, wir führen gerade eine klinische Studie durch. Vor dem Start der Studie führen wir einige Sekundäruntersuchungen durch, die wir als Vorinformationen verwenden können, einschließlich Expertenmeinungen, Ergebnissen früherer klinischer Studien (von unterschiedlicher Relevanz), anderer grundlegender wissenschaftlicher Fakten usw. Wie wird dieses Informationsspektrum kombiniert? (von denen einige nicht quantitativer Natur sind) zu einer vorherigen Wahrscheinlichkeitsverteilung? Geht es nur darum, eine Entscheidung darüber zu treffen, welche Familie ausgewählt und diffus genug gemacht werden soll, um sicherzustellen, dass sie von den Daten überfordert wird, oder wird viel Arbeit geleistet, um eine ziemlich informative vorherige Verteilung zu erreichen?

— Phil
quelle

Siehe stats.stackexchange.com/questions/1/…

— Tim

Ihre Idee, Ihre vorherigen Informationen über 272 Erfolge in 400 Versuchen zu behandeln, hat eine ziemlich solide Bayes'sche Rechtfertigung.

Das Problem , das Sie es zu tun, wie Sie erkennen, ist , dass eine Erfolgswahrscheinlichkeit von Schätzen eines Bernoulli - Experiment. Die Beta-Verteilung ist das entsprechende "konjugierte Prior". Solche konjugierten Priors genießen die "fiktive Beispielinterpretation": $\theta$

Der Beta-Prior ist Dies kann als die Information interpretiert werden, die in einer Stichprobe der Größe (locker, da natürlich keine ganze Zahl sein muss ) mit Erfolgen: Wenn Sie also und , entspricht dies den vorherigen Parametern und

π (θ) = \frac{Γ (α_{0} + β_{0})}{Γ (α_{0}) Γ (β_{0})} θ^{α_{0} - 1} (1 - θ)^{β_{0} - 1}

$\pi(\theta)=\frac{\Gamma(\alpha_0+\beta_0)}{\Gamma(\alpha_0)\Gamma(\beta_0)}\theta^{\alpha_0-1}(1-\theta)^{\beta_0-1}$

\underline{n} = α_{0} + β_{0} - 2

$\underline{n}=\alpha_0+\beta_0-2$

\underline{n}

$\underline{n}$

α_{0} - 1

$\alpha_0-1$

π (θ) = \frac{Γ (α_{0} + β_{0})}{Γ (α_{0}) Γ (β_{0})} θ^{α_{0} - 1} (1 - θ)^{\underline{n} - (α_{0} - 1)}

$\pi(\theta)=\frac{\Gamma(\alpha_0+\beta_0)}{\Gamma(\alpha_0)\Gamma(\beta_0)}\theta^{\alpha_0-1}(1-\theta)^{\underline{n}-(\alpha_0-1)}$

α_{0} + β_{0} - 2 = 400

$\alpha_0+\beta_0-2=400$

α_{0} - 1 = 272

$\alpha_0-1=272$

α_{0} = 273

$\alpha_0=273$

β_{0} = 129

$\beta_0=129$ . Das "Halbieren" der Probe würde zu früheren Parametern und . Denken Sie nun daran, dass der vorherige Mittelwert und die vorherige Varianz der Beta-Verteilung durch Halbieren der Stichprobe bleibt der vorherige Mittelwert (fast) dort, wo er ist:

α_{0} = 137

$\alpha_0=137$

β_{0} = 65

$\beta_0=65$

μ = \frac{α}{α + β} and σ^{2} = \frac{α β}{(α + β)^{2} (α + β + 1)}

$\mu=\frac{\alpha}{\alpha+\beta}\qquad\text{and}\qquad\sigma^2=\frac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}$

alpha01 <- 273
beta01 <- 129
(mean01 <- alpha01/(alpha01+beta01))

alpha02 <- 137
beta02 <- 65
(mean02 <- alpha02/(alpha02+beta02))

erhöht aber die vorherige Varianz von

(priorvariance01 <- (alpha01*beta01)/((alpha01+beta01)^2*(alpha01+beta01+1)))
[1] 0.0005407484

(priorvariance02 <- (alpha02*beta02)/((alpha02+beta02)^2*(alpha02+beta02+1)))
[1] 0.001075066

wie gewünscht.

— Christoph Hanck
quelle