Lassen Sie mich zunächst erklären, was ein konjugierter Prior ist. Ich werde dann die Bayesianischen Analysen anhand Ihres konkreten Beispiels erläutern. Die Bayes'schen Statistiken umfassen die folgenden Schritte:
- Definieren Sie die vorherige Verteilung , die Ihre subjektiven Überzeugungen über einen Parameter enthält (in Ihrem Beispiel ist der interessierende Parameter der Anteil der Linkshänder). Der Prior kann "nicht informativ" oder "informativ" sein (aber es gibt keinen Prior, der keine Informationen enthält, siehe die Diskussion hier ).
- Daten sammeln.
- Aktualisieren Sie Ihre vorherige Verteilung mit den Daten unter Verwendung des Bayes-Theorems, um eine posteriore Verteilung zu erhalten. Die hintere Verteilung ist eine Wahrscheinlichkeitsverteilung, die Ihre aktualisierten Überzeugungen über den Parameter darstellt, nachdem Sie die Daten gesehen haben.
- Analysieren Sie die posteriore Verteilung und fassen Sie sie zusammen (Mittelwert, Median, SD, Quantile, ...).
Die Grundlage aller Bayes'schen Statistiken ist der Bayes'sche Satz
posterior∝prior×likelihood
In Ihrem Fall ist die Wahrscheinlichkeit binomisch. Wenn sich die vorherige und die hintere Verteilung in derselben Familie befinden, werden die vorherige und die hintere Verteilung als konjugierte Verteilungen bezeichnet. Die Betaverteilung ist ein konjugierter Prior, da der Posterior ebenfalls eine Betaverteilung ist. Wir sagen, dass die Beta-Verteilung die konjugierte Familie für die Binomialwahrscheinlichkeit ist. Konjugatanalysen sind praktisch, treten jedoch in der Praxis nur selten auf. In den meisten Fällen muss die posteriore Distribution über MCMC numerisch gefunden werden (mit Stan, WinBUGS, OpenBUGS, JAGS, PyMC oder einem anderen Programm).
Wenn die Prioritätswahrscheinlichkeitsverteilung nicht zu 1 integriert wird, wird sie als unkorrekter Prioritätswert bezeichnet. Wenn sie zu 1 integriert wird, wird sie als korrekter Prioritätswert bezeichnet. In den meisten Fällen ist ein falscher Prior für Bayes-Analysen kein großes Problem. Die posteriore Verteilung muss jedoch korrekt sein, dh der posteriore Wert muss zu 1 integriert werden.
Diese Faustregeln ergeben sich direkt aus der Natur des Bayes'schen Analyseverfahrens:
- Wenn der Prior nicht informativ ist, wird der Posterior sehr stark von den Daten bestimmt (der Posterior ist datengesteuert).
- Wenn der Prior informativ ist, ist der Posterior eine Mischung aus dem Prior und den Daten
- Je informativer die vorherigen Informationen sind, desto mehr Daten müssen Sie "ändern", sozusagen, weil der hintere Teil stark von den vorherigen Informationen bestimmt wird
- Wenn Sie viele Daten haben, dominieren die Daten die posteriore Verteilung (sie überwältigen die vorherige).
Einen hervorragenden Überblick über einige mögliche "informative" und "nicht informative" Prioritäten für die Betaverteilung finden Sie in diesem Beitrag .
Angenommen, Ihre vorherige Betaversion ist wobei der Anteil der Linkshänder ist. Um die vorherigen Parameter und anzugeben , ist es hilfreich, den Mittelwert und die Varianz der Beta-Verteilung zu kennen (z. B. wenn Sie möchten, dass Ihre vorherige einen bestimmten Mittelwert und eine Varianz hat). Der Mittelwert ist . Wenn also , ist der Mittelwert . Die Varianz der Beta-Verteilung ist . Das Praktische ist nun, dass Sie an und denken könnenBeta(πLH|α,β)πLHαβπ¯LH=α/(α+β)α=β0.5αβ(α+β)2(α+β+1)αβwie zuvor beobachtete (Pseudo-) Daten, nämlich -Linkshänder und -Rechtshänder aus einer (Pseudo-) Stichprobe der Größe . Die Verteilung von ist gleichmäßig (alle Werte von sind gleich wahrscheinlich) und entspricht der Beobachtung von zwei Personen Davon ist einer Linkshänder und einer Rechtshänder.αβneq=α+βBeta(πLH|α=1,β=1)πLH
Die hintere Beta-Verteilung ist einfach wobei die Größe der Stichprobe und die Anzahl der Linkshänder in der Stichprobe ist. Das hintere Mittel von ist daher . Um die Parameter der posterioren Beta-Verteilung zu finden, fügen wir einfach Linkshänder zu und Rechtshänder zu . Die hintere Varianz istBeta(z+α,N−z+β)NzπLH(z+α)/(N+α+β)zαN−zβ(z+α)(N−z+β)(N+α+β)2(N+α+β+1). Beachten Sie, dass ein sehr informativer Prior auch zu einer geringeren Varianz der posterioren Verteilung führt (die folgenden Grafiken veranschaulichen den Punkt gut).
In deinem Fall ist und und dein Prior ist die Uniform, die nicht aussagekräftig ist, also ist . Ihre hintere Verteilung ist daher . Der hintere Mittelwert ist . Hier ist eine Grafik, die den Prior, die Wahrscheinlichkeit der Daten und den Posterior zeigtz=2N=18α=β=1Beta(3,17)π¯LH=3/(3+17)=0.15
Sie sehen, dass Ihre nachträgliche Verteilung vollständig von den Daten abhängt, da Ihre vorherige Verteilung nicht aussagekräftig ist. Dargestellt ist auch das höchste Dichteintervall (HDI) für die posteriore Verteilung. Stellen Sie sich vor, Sie legen Ihre hintere Verteilung in ein 2D-Becken und beginnen, Wasser einzufüllen, bis sich 95% der Verteilung über der Wasserlinie befinden. Die Punkte, an denen sich die Wasserlinie mit der posterioren Verteilung schneidet, bilden den 95% -HDI. Jeder Punkt innerhalb des HDI hat eine höhere Wahrscheinlichkeit als jeder Punkt außerhalb. Außerdem enthält der HDI immer den Peak der posterioren Verteilung (dh den Modus). Der HDI unterscheidet sich von einem gleichschwänzigen, zu 95% glaubwürdigen Intervall, bei dem 2,5% von jedem Schwanz des Seitenzahns ausgeschlossen sind (siehe hier ).
Bei Ihrer zweiten Aufgabe werden Sie gebeten, die Information, dass 5-20% der Bevölkerung Linkshänder sind, zu berücksichtigen. Dafür gibt es verschiedene Möglichkeiten. Der einfachste Weg ist zu sagen, dass die vorherige Beta-Verteilung einen Mittelwert von was dem Mittelwert von und . Aber wie wählt man und der vorherigen Betaverteilung aus? Zunächst möchten Sie, dass Ihr Mittelwert der vorherigen Verteilung aus einer Pseudo-Stichprobe mit der entsprechenden Stichprobengröße beträgt . Allgemeiner gesagt, wenn Sie möchten, dass Ihr Vorgänger einen Mittelwert mit einer Pseudo-Stichprobengröße , das entsprechende0.1250.050.2αβ0.125neqmneqαund -Werte sind: und . Jetzt müssen Sie nur noch die Pseudo-Stichprobengröße auswählen, die bestimmt, wie sicher Sie über Ihre vorherigen Informationen sind. Angenommen, Sie sind sich Ihrer vorherigen Informationen sehr sicher und setzen . Die Parameter Ihrer vorherigen Verteilung sind daher und . Die hintere Verteilung ist mit einem Mittelwert von etwa was praktisch dem vorherigen Mittelwert vonβα=mneqβ=(1−m)neqneqneq=1000α=0.125⋅1000=125β=(1−0.125)⋅1000=875Beta(127,891)0.1250.125. Die Vorinformation dominiert den posterioren Bereich (siehe folgende Grafik):
Wenn Sie sich bezüglich der vorherigen Informationen weniger sicher sind, können Sie das Ihres Pseudo-Samples auf beispielsweise , was zu und für Ihre vorherige Beta-Verteilung führt. Die hintere Verteilung ist mit einem Mittelwert von etwa . Der hintere Mittelwert liegt nun in der Nähe des Mittelwerts Ihrer Daten ( ), da die Daten den vorherigen überschreiten. Hier ist die Grafik, die die Situation zeigt:neq10α=1.25β=8.75Beta(3.25,24.75)0.1160.111
Eine fortgeschrittenere Methode zum Einbeziehen der vorherigen Informationen wäre, zu sagen, dass das Quantil Ihrer vorherigen Beta-Verteilung etwa und das Quantil etwa sollte . Dies entspricht der Aussage, dass Sie zu 95% sicher sind, dass der Anteil der Linkshänder an der Bevölkerung zwischen 5% und 20% liegt. Die Funktion im R-Paket berechnet die entsprechenden und Werte einer solchen Quantilen entsprechenden beta-Verteilung. Der Code ist0.0250.050.9750.2beta.select
LearnBayes
αβ
library(LearnBayes)
quantile1=list(p=.025, x=0.05) # the 2.5% quantile should be 0.05
quantile2=list(p=.975, x=0.2) # the 97.5% quantile should be 0.2
beta.select(quantile1, quantile2)
[1] 7.61 59.13
Es scheint, dass eine Beta-Distribution mit den Parametern und die gewünschten Eigenschaften hat. Der vorherige Mittelwert liegt bei was in der Nähe des Mittelwerts Ihrer Daten ( ) liegt. Wiederum beinhaltet diese vorherige Verteilung die Information einer Pseudo-Stichprobe mit einer äquivalenten Stichprobengröße von ungefähr . Die posteriore Verteilung ist mit einem Mittelwert von der mit dem Mittelwert der vorherigen Analyse unter Verwendung eines hochinformativen vor vergleichbar ist. Hier ist die entsprechende Grafik:α=7.61β=59.137.61/(7.61+59.13)≈0.1140.111neq≈7.61+59.13≈66.74Beta(9.61,75.13)0.113Beta(125,875)
Siehe auch diese Referenz für einen kurzen, aber sehr guten Überblick über das Bayes'sche Denken und eine einfache Analyse. Eine längere Einführung für Konjugatanalysen, insbesondere für Binomialdaten, finden Sie hier . Eine allgemeine Einführung in das Bayes'sche Denken finden Sie hier . Weitere Folien zu Aspekten der baysischen Statistik finden Sie hier .