KL Divergenz zwischen zwei univariaten Gaußschen

Ich muss die KL-Divergenz zwischen zwei Gaußschen bestimmen. Ich vergleiche meine Ergebnisse mit diesen , aber ich kann ihr Ergebnis nicht reproduzieren. Mein Ergebnis ist offensichtlich falsch, weil die KL für KL nicht 0 ist (p, p).

Ich frage mich, wo ich einen Fehler mache und ob jemand ihn erkennen kann.

Sei und . Aus Bishops PRML weiß ich das $p(x) = N(\mu_1, \sigma_1)$ $q(x) = N(\mu_2, \sigma_2)$

K L (p, q) = - \int p (x) \log q (x) d x + \int p (x) \log p (x) d x

$KL(p, q) = - \int p(x) \log q(x) dx + \int p(x) \log p(x) dx$

wo die Integration über die gesamte reale Linie erfolgt, und das auch noch

\int p (x) \log p (x) d x = - \frac{1}{2} (1 + \log 2 π σ_{1}^{2}),

$\int p(x) \log p(x) dx = -\frac{1}{2} (1 + \log 2 \pi \sigma_1^2),$

deshalb beschränke ich mich auf , als das ich schreiben kann $\int p(x) \log q(x) dx$

- \int p (x) \log \frac{1}{(2 π σ_{2}^{2})^{(1 / 2)}} e^{- \frac{(x - μ_{2})^{2}}{2 σ_{2}^{2}}} d x,

$-\int p(x) \log \frac{1}{(2 \pi \sigma_2^2)^{(1/2)}} e^{-\frac{(x-\mu_2)^2}{2 \sigma_2^2}} dx,$

das kann in getrennt werden

\frac{1}{2} \log (2 π σ_{2}^{2}) - \int p (x) \log e^{- \frac{(x - μ_{2})^{2}}{2 σ_{2}^{2}}} d x .

$\frac{1}{2} \log (2 \pi \sigma_2^2) - \int p(x) \log e^{-\frac{(x-\mu_2)^2}{2 \sigma_2^2}} dx.$

Ich nehme das Protokoll, das ich bekomme

\frac{1}{2} \log (2 π σ_{2}^{2}) - \int p (x) (- \frac{(x - μ_{2})^{2}}{2 σ_{2}^{2}}) d x,

$\frac{1}{2} \log (2 \pi \sigma_2^2) - \int p(x) \bigg(-\frac{(x-\mu_2)^2}{2 \sigma_2^2} \bigg) dx,$

wo ich die Summen trenne und aus dem Integral erhalte . $\sigma_2^2$

\frac{1}{2} \log (2 π σ_{2}^{2}) + \frac{\int p (x) x^{2} d x - \int p (x) 2 x μ_{2} d x + \int p (x) μ_{2}^{2} d x}{2 σ_{2}^{2}}

$\frac{1}{2} \log (2 \pi \sigma^2_2) + \frac{\int p(x) x^2 dx - \int p(x) 2x\mu_2 dx + \int p(x) \mu_2^2 dx}{2 \sigma_2^2}$

Wenn ich Erwartungsoperator unter bezeichnen $\langle \rangle$ , kann ich dies umschreiben als $p$

\frac{1}{2} \log (2 π σ_{2}^{2}) + \frac{⟨ x^{2} ⟩ - 2 ⟨ x ⟩ μ_{2} + μ_{2}^{2}}{2 σ_{2}^{2}} .

$\frac{1}{2} \log (2 \pi \sigma_2^2) + \frac{\langle x^2 \rangle - 2 \langle x \rangle \mu_2 + \mu_2^2}{2 \sigma_2^2}.$

Wir wissen, dass . Somit $var(x) = \langle x^2 \rangle - \langle x \rangle ^2$

⟨ x^{2} ⟩ = σ_{1}^{2} + μ_{1}^{2}

$\langle x^2 \rangle = \sigma_1^2 + \mu_1^2$

und deshalb

\frac{1}{2} \log (2 π σ^{2}) + \frac{σ_{1}^{2} + μ_{1}^{2} - 2 μ_{1} μ_{2} + μ_{2}^{2}}{2 σ_{2}^{2}},

$\frac{1}{2} \log (2 \pi \sigma^2) + \frac{\sigma_1^2 + \mu_1^2 - 2 \mu_1 \mu_2 + \mu_2^2}{2 \sigma_2^2},$

das kann ich als

\frac{1}{2} \log (2 π σ_{2}^{2}) + \frac{σ_{1}^{2} + (μ_{1} - μ_{2})^{2}}{2 σ_{2}^{2}} .

$\frac{1}{2} \log (2 \pi \sigma_2^2) + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2}.$

Alles zusammen fasse ich zusammen

\begin{aligned} K L (p, q) & = - \int p (x) \log q (x) d x + \int p (x) \log p (x) d x \\ = \frac{1}{2} \log (2 π σ_{2}^{2}) + \frac{σ_{1}^{2} + (μ_{1} - μ_{2})^{2}}{2 σ_{2}^{2}} - \frac{1}{2} (1 + \log 2 π σ_{1}^{2}) \\ = \log \frac{σ_{2}}{σ_{1}} + \frac{σ_{1}^{2} + (μ_{1} - μ_{2})^{2}}{2 σ_{2}^{2}} . \end{aligned}

$\begin{align*} KL(p, q) &= - \int p(x) \log q(x) dx + \int p(x) \log p(x) dx\\\\ &= \frac{1}{2} \log (2 \pi \sigma_2^2) + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2} - \frac{1}{2} (1 + \log 2 \pi \sigma_1^2)\\\\ &= \log \frac{\sigma_2}{\sigma_1} + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2}. \end{align*}$ Das ist falsch, da es für zwei identische Gaußsche entspricht .

1

$1$

Kann jemand meinen Fehler erkennen?

Aktualisieren

Vielen Dank an mpiktas für die Aufklärung. Die richtige Antwort ist:

$KL(p, q) = \log \frac{\sigma_2}{\sigma_1} + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2} - \frac{1}{2}$

normal-distribution kullback-leibler

— bayerj
quelle

Entschuldigung, dass Sie die falsche Antwort eingegeben haben. Ich habe mir gerade und sofort gedacht, dass das Integral Null ist. Der Punkt, dass es quadratisch war völlig verpasst meinen Verstand :)

x - μ_{1}

$x-\mu_1$

— mpiktas

Was ist mit dem Multi-Variate-Fall?

Ich habe gerade in einer Forschungsarbeit gesehen, dass kld $ KL (p, q) = ½ * ((μ₁-μ₂) ² + σ₁² + σ₂²) * ((1 / σ₁²) + (1 / σ₂²) - 2 sein sollte

— Skyde

Ich glaube, Ihre Frage enthält einen Tippfehler, da ich sie nicht validieren kann und Sie anscheinend später in Ihrer Frage die richtige Version verwendet haben: Ich denke, es sollte sein (beachten Sie das Minus): Ich habe versucht, Ihre Frage zu bearbeiten und wurde dafür gesperrt, also machen Sie es vielleicht selbst.

\int p (x) \log p (x) d x = \frac{1}{2} (1 + \log 2 π σ_{1}^{2})

$\int p(x) \log p(x) dx = \frac{1}{2} (1 + \log 2 \pi \sigma_1^2)$

\int p (x) \log p (x) d x = - \frac{1}{2} (1 + \log 2 π σ_{1}^{2})

$\int p(x) \log p(x) dx = -\frac{1}{2} (1 + \log 2 \pi \sigma_1^2)$

— Y-Spreen

Die Antwort findet sich auch in meiner Arbeit von 1996 über innere Verluste .

— Xi'an

Antworten:

OK, mein Schlimmes. Der Fehler ist in der letzten Gleichung:

\begin{aligned} K L (p, q) & = - \int p (x) \log q (x) d x + \int p (x) \log p (x) d x \\ = \frac{1}{2} \log (2 π σ_{2}^{2}) + \frac{σ_{1}^{2} + (μ_{1} - μ_{2})^{2}}{2 σ_{2}^{2}} - \frac{1}{2} (1 + \log 2 π σ_{1}^{2}) \\ = \log \frac{σ_{2}}{σ_{1}} + \frac{σ_{1}^{2} + (μ_{1} - μ_{2})^{2}}{2 σ_{2}^{2}} - \frac{1}{2} \end{aligned}

$\begin{align} KL(p, q) &= - \int p(x) \log q(x) dx + \int p(x) \log p(x) dx\\\\ &=\frac{1}{2} \log (2 \pi \sigma_2^2) + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2} - \frac{1}{2} (1 + \log 2 \pi \sigma_1^2)\\\\ &= \log \frac{\sigma_2}{\sigma_1} + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2} - \frac{1}{2} \end{align}$

$-\frac{1}{2}$ $\mu_1=\mu_2$ $\sigma_1=\sigma_2$

— mpiktas
quelle

@mpiktas Ich meinte die Frage wirklich - bayerj Ist ein gut veröffentlichter Forscher und ich bin ein Undergrad. Schön zu sehen, dass selbst die Schlauen manchmal auf Fragen im Internet zurückgreifen :)

— N. McA.

μ_{1} σ_{1}

$\mu_1 \sigma_1$

μ_{2} σ_{2}

$\mu_2 \sigma_2$

N (u_{1}, σ_{1})

$N(u_1, \sigma_1)$

$p$ $\mu_1$ $\sigma^2_1$ $q$ $\mu_2$ $\sigma^2_2$ $q$ $p$

$\int \left[\log( p(x)) - log( q(x)) \right] p(x) dx$

$=\int \left[ -\frac{1}{2} \log(2\pi) - \log(\sigma_1) - \frac{1}{2} \left(\frac{x-\mu_1}{\sigma_1}\right)^2 + \frac{1}{2}\log(2\pi) + \log(\sigma_2) + \frac{1}{2} \left(\frac{x-\mu_2}{\sigma_2}\right)^2 \right]$ $\times \frac{1}{\sqrt{2\pi}\sigma_1} \exp\left[-\frac{1}{2}\left(\frac{x-\mu_1}{\sigma_1}\right)^2\right] dx$

$=\int \left\{\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{1}{2} \left[ \left(\frac{x-\mu_2}{\sigma_2}\right)^2 - \left(\frac{x-\mu_1}{\sigma_1}\right)^2 \right] \right\}$ $\times \frac{1}{\sqrt{2\pi}\sigma_1} \exp\left[-\frac{1}{2}\left(\frac{x-\mu_1}{\sigma_1}\right)^2\right] dx$

$=E_{1} \left\{\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{1}{2} \left[ \left(\frac{x-\mu_2}{\sigma_2}\right)^2 - \left(\frac{x-\mu_1}{\sigma_1}\right)^2 \right]\right\}$

$=\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{1}{2\sigma_2^2} E_1 \left\{(X-\mu_2)^2\right\} - \frac{1}{2\sigma_1^2} E_1 \left\{(X-\mu_1)^2\right\}$

$=\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{1}{2\sigma_2^2} E_1 \left\{(X-\mu_2)^2\right\} - \frac{1}{2}$

$(X - \mu_2)^2 = (X-\mu_1+\mu_1-\mu_2)^2 = (X-\mu_1)^2 + 2(X-\mu_1)(\mu_1-\mu_2) + (\mu_1-\mu_2)^2$

$=\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{1}{2\sigma_2^2} \left[E_1\left\{(X-\mu_1)^2\right\} + 2(\mu_1-\mu_2)E_1\left\{X-\mu_1\right\} + (\mu_1-\mu_2)^2\right] - \frac{1}{2}$

$=\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{\sigma_1^2 + (\mu_1-\mu_2)^2}{2\sigma_2^2} - \frac{1}{2}$

— Ocram
quelle