EM-Algorithmus Übungsproblem


9

Dies ist ein Übungsproblem für eine Zwischenprüfung. Das Problem ist ein Beispiel für einen EM-Algorithmus. Ich habe Probleme mit Teil (f). Ich liste die Teile (a) - (e) zur Vervollständigung auf und falls ich früher einen Fehler gemacht habe.

Sei unabhängige exponentielle Zufallsvariablen mit der Rate . Leider werden die tatsächlichen Werte nicht beobachtet, und wir beobachten nur, ob die Werte innerhalb bestimmter Intervalle liegen. Sei , und für . Die beobachteten Daten bestehen aus .X1,,XnθXXG1j=1{Xj<1}G2j=1{1<Xj<2}G3j=1{Xj>2}j=1,,n(G1j,G2j,G3j)

(a) Geben Sie die beobachtete Datenwahrscheinlichkeit an:

L(θ|G)=j=1nPr{Xj<1}G1jPr{1<Xj<2}G2jPr{Xj>2}G3j=j=1n(1eθ)G1j(eθe2θ)G2j(e2θ)G3j

(b) Geben Sie die vollständige Datenwahrscheinlichkeit an

L(θ|X,G)=j=1n(θeθxj)G1j(θeθxj)G2j(θeθxj)G3j

(c) Leiten Sie die Vorhersagedichte der latenten Variablenf(xj|G,θ)

f(xj|G,θ)=fX,G(xj,g)fG(g)=θeθxj1{xjregion r s.t. Grj=1}(1eθ)g1j(eθe2θ)g2j(e2θ)g3j

(d) E-Schritt. Geben Sie die FunktionQ(θ,θi)

Q(θ,θi)=EX|G,θi[logf(x|G,θ)]=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)N2log(eθe2θ)N3loge2θ=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)N2log(eθ(1eθ))+2θN3=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)+θN2N2log(1eθ)+2θN3

wobeiN1=j=1ng1j,N2=j=1ng2j,N3=j=1ng3j

(e) Geben Sie Ausdrücke für für . r = 1 , 2 , 3E[Xj|Grj=1,θi]r=1,2,3

Ich werde meine Ergebnisse auflisten, von denen ich mir ziemlich sicher bin, dass sie richtig sind, aber die Ableitungen wären für diese bereits lange Frage etwas lang:

E[Xj|G1j=1,θi]=(11eθi)(1θieθi(1+1/θi))E[Xj|G2j=1,θi]=(1eθie2θi)(eθi(1+1/θi)e2θi(2+1/θi))E[Xj|G3j=1,θi]=(1e2θi)(e2θi(2+1/θi))

Dies ist der Teil, an dem ich festhalte, und es könnte an einem früheren Fehler liegen:

(f) M-Schritt. Finden Sie das , das maximiertQ ( θ , θ i )θQ(θ,θi)

Nach dem Gesetz der totalen Erwartung haben wir DafürE[Xj|G,θi]=(1θieθi(1+1/θi))+(eθi(1+1/θi)e2θi(2+1/θi))+(e2θi(2+1/θi))=1/θi

Q(θ,θi)=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)+θN2N2log(1eθ)+2θN3=nlogθθnθiN1log(1eθ)+θN2N2log(1eθ)+2θN3Q(θ,θi)θ=nθnθi(N1+N2)eθ1eθ+N2+2N3

Als nächstes sollte ich dies auf Null setzen und nach lösen , aber ich habe dies sehr lange versucht und ich kann nicht nach lösen !θθθ


Ich interpretierte für eine Minute als eine Kraft von . Am verwirrendsten. Normalerweise wird die Iterationsnummer (Schrittnummer) in Klammern oder Klammern damit nicht mit der ten Potenz verwechselt wird . Wahrscheinlich am besten zu sagen, dass es das ist, worum es in der Frage geht (vorausgesetzt, ich habe es jetzt richtig). θ [ i ] ( i ) θ ( i ) i θ iθiθ[i](i)θ(i)iθi
Glen_b -State Monica

1
Ja Glen, tut mir leid, es ist in der Tat die te Iteration des EM-Algorithmus. i
Bdeonovic

Antworten:


5

Die vollständige Datenwahrscheinlichkeit sollte nicht G! Es sollte einfach die Wahrscheinlichkeit von wenn die exponentiell sind. Beachten Sie, dass sich die vollständige Datenwahrscheinlichkeit, wie Sie sie geschrieben haben, zu einer exponentiellen Wahrscheinlichkeit vereinfacht, da nur eines der kann. Wenn Sie die in der vollständigen Datenwahrscheinlichkeit belassen, werden Sie jedoch später durcheinander gebracht. X G r j G.θXGrjG

In Teil (d) sollte die Erwartung der vollständigen Datenprotokollwahrscheinlichkeit und nicht der beobachteten Datenprotokollwahrscheinlichkeit berücksichtigt werden.

Sie sollten auch nicht das Gesetz der totalen Erwartung anwenden! Denken Sie daran, dass G beobachtet wird und nicht zufällig ist. Sie sollten daher nur eine dieser bedingten Erwartungen für jedes ausführen . Ersetzen Sie diese bedingte Erwartung einfach durch den Term und führen Sie dann den M-Schritt aus.X ( i ) jXjXj(i)


@ Benjamin Wie kommt das Problem voran? Konnte ich Ihnen helfen, zu verstehen, wie es geht?
Jsk

Danke für die Kommentare @jsk. Ich war letzte Nacht müde, also bin ich ins Bett gegangen, aber ich werde das heute Morgen nach dem Frühstück wieder angehen :)
Bdeonovic

Ich glaube, ich habe es herausgefunden! Danke nochmal! Dies war eigentlich in Vorbereitung auf ein Finale, das ich heute habe, also hat es wirklich geholfen, einige Dinge über die EM zu klären.
Bdeonovic

Bitte. Hoffe dein Finale läuft heute gut!
Jsk

4

Basierend auf den Kommentaren von @ jsk werde ich versuchen, meine Fehler zu beheben:

L(θ|X,G)=j=1nθeθxj

Q(θ,θi)=nlogθθj=1nE[Xj|G,θi]=nlogθθ(j=1ng1j1eθi)(1θieθi(1+1/θi))θ(j=1ng2jeθi(1eθi))(eθi(1+1/θi)e2θi(2+1/θi))θ(j=1ng3je2θi)(e2θi(2+1/θi))=nlogθθN1AθN2BθN3CQ(θ,θi)θ=nθN1AN2BN3C=set0

wir nach lösen, erhalten wirθ ( i + 1 ) = nθθ(i+1)=nN1A+N2B+N3C

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.