Variationsinferenz, KL-Divergenz erfordert wahres


12

Nach meinem (sehr bescheidenen) Verständnis der Variationsinferenz versucht man, eine unbekannte Verteilung zu approximieren, pindem man eine Verteilung q , die Folgendes optimiert:

KL(p||q)=xp(x)logp(x)q(x)

Immer wenn ich Zeit in das Verständnis von Variationsinferenzen investiere, treffe ich diese Formel und kann nicht anders, als das Gefühl zu haben, dass ich den Punkt verfehle. Es scheint, als müsste ich kennen p, um berechnen zu können KL(p||q). Aber der springende Punkt war ich nicht diese Verteilung wusste p .

Es ist genau dieser Punkt, der mich jedes Mal nervt, wenn ich versuche, etwas Variierendes zu lesen. Was vermisse ich?

EDIT :

Ich werde hier aufgrund der Antwort von @wij ein paar zusätzliche Kommentare hinzufügen. Ich werde versuchen, genauer zu sein.

In den Fällen, an denen ich interessiert bin, erscheint es durchaus vernünftig zu bedenken, dass Folgendes gilt:

p(θ|D)=p(D|θ)p(θ)p(D)p(D|θ)p(θ)

In diesem Fall könnte ich wissen, wie proportional aussehen sollte, da ich eine Modellauswahl für p ( D | θ ) und p ( θ ) getroffen habe . Würde ich dann richtig sagen, dass ich dann eine Familienverteilung q [sagen wir Gauß] auswählen muss, so dass ich jetzt K L ( p ( θ | D ) | | q ) schätzen kann . Es fühlt sich so an, als würde ich in diesem Fall versuchen, einen Gaußschen Wert anzupassen, der nahe am nicht normalisierten p ( D | θ ) liegt.pp(D|θ)p(θ)qKL(p(θ|D)||q) . Ist das richtig?p(D|θ)p(θ)

Wenn ja, gehe ich davon aus, dass mein posterior eine Normalverteilung ist, und ich versuche lediglich, wahrscheinliche Werte für diese Verteilung in Bezug auf die -Divergenz zu finden.KL

Antworten:


7

Ich habe das Gefühl, dass Sie als ein völlig unbekanntes Objekt behandeln. Ich glaube nicht, dass dies der Fall ist. Das haben Sie wahrscheinlich verpasst.p

Nehmen wir an, wir beobachten (iid) und wollen auf p ( x | Y ) schließen, wobei wir annehmen, dass p ( y | x ) und p ( x ) für x R d durch spezifiziert sind das Model. Nach der Bayes-RegelY={yi}i=1np(x|Y)p(y|x)p(x)xRd

p(x|Y)=p(x)p(Y)p(Y|x)=p(x)p(Y)i=1np(yi|x).

Die erste Beobachtung ist, dass wir etwas über die posteriore Verteilung wissen . Es ist wie oben angegeben. Normalerweise kennen wir den Normalisierer p ( Y ) einfach nicht . Wenn die Wahrscheinlichkeit p ( y | x ) sehr kompliziert ist, haben wir am Ende eine komplizierte Verteilung p ( x | Y ) .p(x|Y)p(Y)p(y|x)p(x|Y)

Das zweite, was es möglich macht, Variationsinferenzen durchzuführen, ist, dass die Form, die annehmen kann, eingeschränkt ist. Ohne jede Einschränkung, arg min q K L ( p | | q ) wäre p die in der Regel unlösbar ist. Typischerweise wird angenommen , dass q in einer ausgewählten Teilmenge der Exponentialfamilie lebt. Dies könnte beispielsweise die Familie der vollständig faktorisierten Gaußschen Verteilungen sein, dh q Q = { d i = 1 q i ( x i ) qargminqKL(p||q)pq . Es stellt sich heraus, dass, wenn dies Ihre Einschränkungsmenge ist, jede Komponente von q durch gegeben istqQ={i=1dqi(xi)each qi is a one-dimensional Gaussian}q

qiexp(Ejiqjlogp(x,Y)),

wobei Die genaue Formel spielt keine Rolle. Der Punkt ist, dass das ungefähre q gefunden werden kann, indem man sich auf die Kenntnis des wahren p und die Annahme der Form stützt , die das ungefähre q annehmen sollte.p(x,Y)=p(x)i=1np(yi|x).qpq

Aktualisieren

Im Folgenden wird der aktualisierte Teil der Frage beantwortet. Ich habe gerade festgestellt, dass ich über nachgedacht habe . Ich werde immer p für die wahre Menge und q für eine ungefähre Menge verwenden . In Variationsinferenz oder Variationsbayes ist q gegeben durchKL(q||p(x|Y))pqq

q=argminqQKL(q||p(x|Y)).

Mit der oben festgelegten Einschränkungsmenge ist die Lösung die zuvor angegebene. Nun, wenn Sie darüber nachdenkenQ

q=argminqQKL(p(x|Y)||q),

Wenn als Teilmenge der Exponentialfamilie definiert ist, wird diese Folgerung als Expectation Propagation (EP) bezeichnet. Die Lösung für q ist in diesem Fall diejenige, bei der ihre Momente mit denen von p ( x | Y ) übereinstimmen .Qqp(x|Y)

q


Ich kann damit nicht streiten. Ich denke, die meisten Erklärungen einschließlich meines eigenen Glanzes darüber.
Peadar Coyle
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.