Welche Verteilung hat die maximale Entropie für eine bekannte mittlere absolute Abweichung?


10

Ich habe die Diskussion in Hacker News über die Verwendung der Standardabweichung im Gegensatz zu anderen Metriken wie der mittleren absoluten Abweichung gelesen . Wenn wir also dem Prinzip der maximalen Entropie folgen würden, mit welcher Art von Verteilung würden wir arbeiten, wenn wir nur den Mittelwert der Verteilung und die mittlere absolute Abweichung kennen würden?

Oder ist es sinnvoller, den Median und die mittlere absolute Abweichung vom Median zu verwenden?

Ich habe ein Papier Maximum Entropy Principle mit allgemeinen Abweichungsmaßen von Grechuk, Molyboha und Zabarankin gefunden, das die Informationen zu enthalten scheint, auf die ich neugierig bin, aber es dauert eine Weile, bis ich sie entschlüsselt habe.


Interessante Frage; Willkommen bei Cross Validated!
Nick Stauner

Antworten:


13

Diese weisen Herren, Kotz, S., Kozubowski, TJ & Podgorski, K. (2001). Die Laplace-Verteilung und Verallgemeinerungen: Ein Rückblick auf Anwendungen in den Bereichen Kommunikation, Wirtschaft, Ingenieurwesen und Finanzen (Nr. 183). Springer.

Fordern Sie uns mit einer Übung heraus:

Geben Sie hier die Bildbeschreibung ein

Der Beweis kann dem informationstheoretischen Beweis folgen, dass das Normal die maximale Entropie für den gegebenen Mittelwert und die gegebene Varianz ist. Insbesondere: Sei die obige Laplace-Dichte und sei eine beliebige andere Dichte, die jedoch den gleichen Mittelwert und die gleiche mittlere absolute Abweichung aufweist. Dies bedeutet, dass folgende Gleichheit gilt:f(x)g(x)

Eg(|Xc1|)=g(x)|xc1|dx=c2=f(x)|xc1|dx=Ef(|Xc1|)[1]
Betrachten Sie nun die Kullback-Leibler-Divergenz der beiden Dichten:

0DKL(g||f)=g(x)ln(g(x)f(x))dx=g(x)lng(x)dxg(x)lnf(x)dx[2]

Das erste Integral ist das Negativ der (Differential-) Entropie von , bezeichnet es . Das zweite Integral ist (explizit das Laplace-PDF schreiben)gh(g)

g(x)ln[f(x)]dx=g(x)ln[12c2exp{1c2|xc1|}]dx
=ln[12c2]g(x)dx1c2g(x)|xc1|dx
Das erste Integral integriert sich zur Einheit und verwendet auch Gl. wir[1]

g(x)ln[f(x)]dx=ln[2c2]1c2f(x)|xc1|dx=(ln[2c2]+1)
Dies ist jedoch das Negative der Differentialentropie des Laplace, bezeichne es .h(f)

Einfügen dieser Ergebnisse in Gl. wir haben Da willkürlich war, beweist dies, dass die oberhalb der Laplace-Dichte ist die maximale Entropie unter allen Verteilungen mit den obigen Vorschriften.[2]

0D(g||f)=h(g)(h(f))h(g)h(f)
g

So eine einfache Verteilung und auch eine schöne Zusammenfassung! Ich vermutete, dass die Verteilung glatt sein würde, außer bei 0.
Dietrich Epp

Vielen Dank. Manchmal "das gleiche geht mit dem gleichen" - da die Laplace-Verteilung den absoluten Wert enthält, war sie ein Hauptverdächtiger.
Alecos Papadopoulos
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.