1. Schätzer der Grenzwahrscheinlichkeit und des harmonischen Mittels
Die marginale Wahrscheinlichkeit ist definiert als die Normalisierungskonstante der posterioren Verteilung
p ( x ) = ∫Θp ( x | θ ) p ( θ )dθ .
Die Bedeutung dieser Größe ergibt sich aus der Rolle, die sie beim Modellvergleich über Bayes-Faktoren spielt .
Es wurden verschiedene Methoden vorgeschlagen, um diese Menge anzunähern. Raftery et al. (2007) schlagen den Harmonic Mean Estimator vor , der aufgrund seiner Einfachheit schnell populär wurde. Die Idee besteht darin, die Relation zu verwenden
1p(x)=∫Θp(θ|x)p(x|θ)dθ.
Deshalb, wenn man eine Probe von der posterioren hat, sagen , kann diese Menge durch angenähert werden(θ1,...,θN)
1p(x)≈1N∑j=1N1p(x|θj).
Diese Annäherung steht im Zusammenhang mit dem Konzept der Stichprobenerhebung .
Nach dem Gesetz der großen Zahlen, wie es in Neals Blog diskutiert wird , ist dieser Schätzer konsistent . Das Problem ist, dass das für eine gute Approximation erforderliche sehr groß sein kann. In Neals Blog oder Roberts Blog 1 , 2 , 3 , 4 finden Sie einige Beispiele.N
Alternativen
Es gibt viele Alternativen zur Approximation von . Chopin und Robert (2008)stellen einige auf Stichproben basierende Methoden von Bedeutung vor.p(x)
2. Lassen Sie Ihren MCMC-Sampler nicht lange genug laufen (besonders bei Multimodalität)
Mendoza und Gutierrez-Peña (1999) leiten die Referenzprior / posterior für das Verhältnis zweier normaler Mittelwerte her und präsentieren ein Beispiel für die mit diesem Modell erhaltenen Schlussfolgerungen unter Verwendung eines realen Datensatzes. Unter Verwendung von MCMC-Methoden erhalten sie eine Stichprobe der Größe des posterioren Verhältnisses der Mittelwerte2000 das unten gezeigt istφ
φ (0.63,5.29)00
(0,7.25)
3. In dieser Diskussion von Gelman, Carlin und Neal finden sich einige andere Punkte wie die Beurteilung der Konvergenz, die Wahl der Ausgangswerte und das schlechte Verhalten der Kette .
4. Wichtigkeitsprobe
Ein Verfahren zur Approximation eines Integrals besteht darin, den Integranden mit einer Dichte multipliziereng , mit der gleichen Unterstützung, die wir simulieren können
I=∫f(x)dx=∫f(x)g(x)g(x)dx.
g(x1,...,xN)I wie folgt
I≈1N∑j=1Nf(xj)g(xj).
gfN
# Integrating a Student's t with 1 d.f. using a normal importance function
x1 = rnorm(10000000) # N=10,000,000
mean(dt(x1,df=1)/dnorm(x1))
# Now using a Student's t with 2 d.f. function
x2 = rt(1000,df=2)
mean(dt(x2,df=1)/dt(x2,df=2))