Ableitung von Normal-Wishart posterior


11

Ich arbeite an der Ableitung eines Normal-Wishart-Posterior, stecke aber bei einem der Parameter fest (dem Posterior der Skalenmatrix, siehe unten).

Nur für den Kontext und die Vollständigkeit, hier ist das Modell und der Rest der Ableitungen:

xiN(μ,Λ)μN(μ0,(κ0Λ)1)ΛW(υ0,W0)

Die erweiterten Formen jedes der drei Faktoren sind (bis zu einer Proportionalitätskonstante):

  • Wahrscheinlichkeit:

    N(xi|μ,Λ)|Λ|N/2exp(12i=1N(xiTΛxi2μTΛxi+μTΛμ))
  • Normal vor:

    N(μ|(μ0,κ0Λ)1)|Λ|1/2exp(12(μTκ0Λμ2μTκ0Λμ0+μ0Tκ0Λμ0))
  • Wishart prior:

    W(Λ|υ0,W0)|Λ|υ0D12exp(12tr(W01Λ))

Wir wollen den hinteren Normal-Wishart ( ), der zerlegt werden kann als sowie :μ,Λ|μ,κ,υ,WN(μ|μ,κΛ)W(Λ|υ,W)

Freiheitsgradυ

Durch Zusammenführen der ersten Faktoren der Wahrscheinlichkeit und des Wishart erhalten wir den ersten Faktor des Wishart-Faktors im hinteren Bereich: und daher haben wir den ersten Parameter des Seitenzahns:

|Λ|υ0+ND12
υ=υ0+N

Skalierungsfaktorκ

Wir identifizieren die Elemente, die von und um herauszufinden, wer das vorherige durch die Wahrscheinlichkeit aktualisiert wird: und daher haben wir den zweiten Parameter: μ κ 0 Λ μ T ( ( κ 0 + N ) Λ ) μ κ = κ 0 + N.μTμκ0Λ

μT((κ0+N)Λ)μ
κ=κ0+N

Mittleresμ

Der dritte Parameter ergibt sich aus der Identifizierung dessen, was sich in : Und deshalb haben wir den dritten Parameter: 2 μ T ( Λ N ¯ x + κ 0 Λ μ 0 )2μT...μ ' = 1

2μT(ΛNx¯+κ0Λμ0)=2μTκΛμ(ΛNx¯+κ0Λμ0)=κΛμ(Nx¯+κ0μ0)=κμ
μ=1k(Nx¯+κ0μ0)

Skalieren Sie die MatrixW

Und der vierte Parameter stammt aus der Arbeit an den verbleibenden Parametern:

tr(W1Λ)=tr(W01Λ)+i=1NxiTΛxi+μ0Tκ0Λμ0=tr(W01Λ)+i=1Ntr(xiTΛxi)+tr(μ0T.κ0Λμ0)=tr(W.0- -1Λ+ich=1N.xichT.Λxich+μ0T.κ0Λμ0)

Wie gehe ich von hier aus vor (wenn ich bisher keine Fehler gemacht habe) und erhalte die Standardlösung für ?W.'

Bearbeiten 1 :

Jetzt ordnen wir die Terme neu an, addieren und subtrahieren einige Faktoren, um zwei Quadrate wie in der Standardlösung zu erhalten:

tr(W1Λ)=tr(W1Λ+i=1N(xiTΛxi+x¯TΛx¯2xiTΛx¯)+κ0(μ0TΛμ0+x¯TΛx¯2x¯TΛμ0)i=1Nx¯TΛx¯+2i=1NxiTΛx¯κ0x¯TΛx¯+2κ0x¯TΛμ0)=tr(W1Λ+i=1N(xix¯)Λ(xix¯)T+κ0(x¯μ0)Λ(x¯μ0)TNx¯Λx¯T+2Nx¯Λx¯Tκ0x¯Λx¯T+2κ0x¯Λμ0T)

Wir vereinfachen die Faktoren, die außerhalb der Quadrate bleiben:

tr(W1Λ)=tr(W1Λ+i=1N(xix¯)TΛ(xix¯)+κ0(x¯μ0)TΛ(x¯μ0)+(Nκ0)x¯TΛx¯+2κ0x¯TΛμ0)

Edit 2 ( Follow-up dank @bdeonovics Antwort )

Die Spur ist zyklisch, also ist . Dann: und dann: tr(ABC)=tr(BCA)=tr(CAB)

tr(W1Λ)=tr(W1Λ+i=1N(xix¯)(xix¯)TΛ+κ0(x¯μ0)(x¯μ0)TΛ+(Nκ0)x¯x¯TΛ+2κ0x¯μ0TΛ)
tr(W1)=tr(W1+i=1N(xix¯)(xix¯)T+κ0(x¯μ0)(x¯μ0)T+(Nκ0)x¯x¯T+2κ0x¯μ0T)

Fast! Aber immer noch nicht da. Das Ziel ist:

W1+i=1N(xix¯)(xix¯)T+κ0Nκ0+N(x¯μ0)(x¯μ0)T

Antworten:


4

Die Spur ist zyklisch, also ist . Auch die Spur verteilt sich über die Addition, so dass . Mit diesen Fakten sollten Sie in der Lage sein, den Term in den Trace-Begriffen nach hinten zu verschieben und die Trace-Begriffe miteinander zu kombinieren. Das Ergebnis sollte ungefähr so ​​aussehen wietr(ABC)=tr(BCA)=tr(CAB)tr(A+B)=tr(A)+tr(B)Λ

W1=W1+i=1Nxixi+μ0μ0

Vielen Dank! Ich sehe jedoch nicht, wie ich von dort zu den Standardergebnissen ( en.wikipedia.org/wiki/Conjugate_prior ) die und . Ich habe nicht einmal negative Vorzeichen: O(xix¯)x¯μ0
Alberto

3

Die Wahrscheinlichkeit vorher ist ×

|Λ|N/2exp{12(i=1NxiTΛxiNx¯TΛμμTΛNx¯+NμTΛμ)}×|Λ|(ν0D1)/2exp{12tr(W01Λ)}×|Λ|1/2exp{κ02(μTΛμμTΛμ0μ0TΛμ+μ0TΛμ0)}.
Dies kann als Wir können umschreiben
|Λ|1/2|Λ|(ν0+ND1)/2×exp{12((κ0+N)μTΛμμTΛ(κ0μ0+Nx¯)(κ0μ0+Nx¯)TΛμ+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ))}
(κ0+N)μTΛμμTΛ(κ0μ0+Nx¯)(κ0μ0+Nx¯)TΛμ+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ)
wie folgt durch Addieren und Subtrahieren eines Terms:
(κ0+N)μTΛμμTΛ(κ0μ0+Nx¯)(κ0μ0+Nx¯)TΛμ+1κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)1κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ).
Die beiden oberen Zeilen faktorisieren jetzt als
(κ0+N)(μκ0μ+Nx¯κ0+N)TΛ(μκ0μ+Nx¯κ0+N).

Addiere und subtrahiere folgt: kann umgeschrieben werden als Nx¯TΛx¯

1κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ)
i=1N(xiTΛxixiTΛx¯x¯TΛxi+x¯TΛx¯)+Nx¯TΛx¯+κ0μ0TΛμ01κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)+tr(W01Λ).
Der Summenbegriff
i=1N(xiTΛxixiTΛx¯x¯TΛxi+x¯TΛx¯)
entspricht Jetzt kann erweitert werden als
i=1N(xix¯)TΛ(xix¯).
Nx¯TΛx¯+κ0μ0TΛμ01κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)
Nx¯TΛx¯+κ0μ0TΛμ01κ0+N(κ02μ0TΛμ0+Nκ0μ0TΛx¯0+Nκ0x¯TΛμ0+N2x¯TΛx¯),
was gleich ist
Nκ0κ0+N(x¯TΛx¯x¯TΛμ0μ0TΛx¯+μ0TΛμ0)=Nκ0κ0+N(x¯μ0)TΛ(x¯μ0).

Die folgenden zwei Begriffe sind Skalare: Und jeder Skalar ist gleich seiner Spur, also

i=1N(xix¯)TΛ(xix¯),Nκ0κ0+N(x¯μ0)TΛ(x¯μ0).
tr(W01Λ)+i=1N(xix¯)TΛ(xix¯)+Nκ0κ0+N(x¯μ0)TΛ(x¯μ0)
kann umgeschrieben werden als Da , ist die obige Summe gleich
tr(W01Λ)+tr(i=1N(xix¯)TΛ(xix¯))+tr(Nκ0κ0+N(x¯μ0)TΛ(x¯μ0)).
tr(ABC)=tr(CAB)
tr(W01Λ)+tr(i=1N(xix¯)(xix¯)TΛ)+tr(Nκ0κ0+N(x¯μ0)(x¯μ0)TΛ).
Unter Verwendung der Tatsache, dass , können wir die Summe umschreiben als tr(A+B)=tr(A)+tr(B)
tr(W01Λ+i=1N(xix¯)(xix¯)TΛ+Nκ0κ0+N(x¯μ0)(x¯μ0)TΛ)=tr((W01+i=1N(xix¯)(xix¯)T+Nκ0κ0+N(x¯μ0)(x¯μ0)T)Λ).

Alles zusammen, wenn wir wir haben, dass die Wahrscheinlichkeit vorher gleich ist S=i=1N(xix¯)(xix¯)T×

|Λ|1/2exp{κ0+N2(μκ0μ+Nx¯κ0+N)TΛ(μκ0μ+Nx¯κ0+N)}×|Λ|(ν0+ND1)/2exp{12tr((W01+S+Nκ0κ0+N(x¯μ0)(x¯μ0)T)Λ)},
nach Bedarf.
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.