Den Konzentrationsparameter in einem Dirichlet-Prozess priorisieren


9

Das meiste davon ist Hintergrund. Fahren Sie bis zum Ende fort, wenn Sie bereits genug über Dirichlet-Prozessmischungen wissen . Angenommen, ich modelliere einige Daten als aus einer Mischung von Dirichlet-Prozessen stammend, dh lassen Sie und abhängig von annehmenFD(αH)F

Yiiidf(y|θ)F(dθ).

Hier ist und das vorherige Basismaß. Es stellt sich heraus, dass , wenn ich für jede Beobachtung das zugehörige latente , die Wahrscheinlichkeit von in diesem Modell wobei die Anzahl der unterschiedlichen Werte von (das Zufallsmaß ist fast sicher diskret). Escobar und West entwickeln das folgende Schema für die Abtastung von Verwendung eines Gamma-Prior; Zuerst schreiben sieα>0αHYiθiα

L(α|t)αtΓ(α)Γ(α+n)
tθiFα
π(α|t)π(α)αtΓ(α)Γ(α+n)π(α)αt1(α+n)B(α+1,n)=π(α)αt1(α+n)01xα(1x)n1 dx,
wobei die Beta-Funktion ist. Beachten Sie dann, dass, wenn wir einen latenten Parameter einführen die Wahrscheinlichkeit die Form einer Mischung von Gamma-Verteilungen hat und verwenden Sie diese, um einen Gibbs-Sampler aufzuschreiben.B(,)XBeta(α+1,n)

Nun meine Frage. Warum können wir nicht einfach schreiben und anstatt eine Mischung von Gammaverteilungen zu verwenden, verwenden Sie eine einzelne Gammaverteilung? Wenn wir einführen sollte ich dann nicht in der Lage sein, dasselbe zu tun, ohne die Mischung verwenden zu müssen?

L(α|t)αtΓ(α)Γ(α+n)=αtΓ(n)Γ(α)Γ(α+n)Γ(n)=αtB(α,n)Γ(n)αt01xα1(1x)n1 dx,
XBeta(α,n)

Für weitere Details bearbeiten Weitere Details: Um einige Lücken zu schließen, lautet das Argument in Escobar und West, dass eine Gamma-Verteilung mit der Form und , bedeuten soll und so können wir vorstellen ein latentes so dassDie vollständigen Bedingungen sind eine -Verteilung für und eine Mischung aus a und aαaa/b

π(α|t)αa+t2(α+n)ebα01xα(1x)n1 dx
X
π(α,x|t)αa+t2(α+n)ebαxα(1x)n1.
Beta(α+1,n)XG(a+t,blog(x))G(a+t1,blog(x)) für .α

Mit dem gleichen Argument habe ich das gleiche Ergebnis erhalten, jedoch mit für und für . Das scheint mir einfacher zu sein; warum machen sie das nicht einfach?Beta(α,n)XG(a+t,blog(x))α

Antworten:


3

Ich verstehe nicht, wie sich das, was Sie geschrieben haben, grundlegend von Escobar und West unterscheidet.

π(α|t)π(α)π(t|α)=π(α)L(α|t)π(α)αtΓ(α)Γ(α+n)π(α)αtΓ(α)Γ(n)Γ(α+n)=π(α)αtB(α,n)=π(α)αt1(α+n)B(α+1,n)
wobei die vorletzte Zeile so ist, wie Sie sie haben, und die letzte Zeile so ist, wie E & W hat es und sie sind gleich, da n) \ end {eqnarray *} erinnert sich daran
αB(α,n)=αΓ(α)Γ(n)Γ(α+n)=(αΓ(α))Γ(n)(α+n)(Γ(α+n)(α+n))=(α+n)Γ(α+1)Γ(n)Γ(α+n+1)=(α+n)B(α+1,n)
Γ(z+1)=zΓ(z) .

Ich vermute, dass sie ihre Formulierung Ihrer vorgezogen haben, weil sie nur den Beta-Funktionsbegriff hat, nicht das Produkt einer Beta und eines Gammas, aber ich könnte mich irren. Ich habe das letzte Stück, das Sie geschrieben haben, nicht ganz befolgt. Könnten Sie Ihr Stichprobenschema genauer erläutern?


Zusätzliche Details in meinem Beitrag hinzugefügt.
Kerl
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.