Earth Mover's Distance (EMD) zwischen zwei Gaußschen


26

Gibt es eine geschlossene Formel für die EMD zwischen x1N(μ1,Σ1) und x2N(μ2,Σ2) ?


2
Laut en.wikipedia.org/wiki/Earth_mover%27s_distance ist der EMD derselbe wie der Malven- oder Wasserstein-Abstand, also können Sie versuchen, das zu googeln.
kjetil b halvorsen

2
Sie finden dieses Dokument
jojer

Antworten:


27

Die Entfernung des Erdbewegers kann als , wobei das Infimum über alle gemeinsamen Verteilungen von X und übernommen wird Y Rn X \ sim P , Y \ sim Q . Dies ist auch als der erste Wasserstein-Abstand bekannt , der W_p = \ inf \ left (\ E \ lVert X - Y \ rVert ^ p \ right) ^ {1 / p} mit demselben Infimum ist.EMD(P,Q)=infEXYXYXPYQWp=inf(EXYp)1/p

Sei XP=N(μx,Σx) , YQ=N(μy,Σy) .

Untergrenze: Nach Jensens Ungleichung ist die EMD , da die Normen konvex sind, immer

EXYE(XY)=μxμy,
mindestens der Abstand zwischen den Mitteln (für etwaige Verteilungen).

Obere Schranke basierend auf W2 : Wiederum durch Jensens Ungleichung (EXY)2EXY2 . Also W1W2 . Aber Dowson und Landau (1982) stellen fest, dass

W2(P,Q)2=μxμy2+tr(Σx+Σy2(ΣxΣy)1/2),
mit einer Obergrenze für EMD=W1 .

Eine engere obere Schranke: Betrachten Sie die Kopplung Dies ist die von Knott und Smith (1984) abgeleitete Karte. , Zur optimalen Abbildung von Verteilungen , Journal of Optimization Theory and Applications, 43 (1), S. 39-49 als optimale Abbildung für ; Siehe auch diesen Blog-Beitrag . Beachten Sie, dass und

XN(μx,Σx)Y=μy+Σx12(Σx12ΣyΣx12)12Σx12A(Xμx).
W2A=ATEYW2A=AT
EY=μy+A(EXμx)=μyVarY=AΣxAT=Σx12(Σx12ΣyΣx12)12Σx12ΣxΣx12(Σx12ΣyΣx12)12Σx12=Σx12(Σx12ΣyΣx12)Σx12=Σy,
damit die Kopplung gültig ist.

Der Abstand ist dann , wobei nun was normal ist mit XYD

D=XY=XμyA(Xμx)=(IA)Xμy+Aμx,
ED=μxμyVarD=(IA)Σx(IA)T=Σx+AΣxAAΣxΣxA=Σx+ΣyΣx12(Σx12ΣyΣx12)12Σx12Σx12(Σx12ΣyΣx12)12Σx12.

Somit gebunden ein oberes für ist . Leider ist eine geschlossene Form für diese Erwartung überraschend unangenehm für die allgemeinen multivariate Normale aufzuschreiben: siehe diese Frage , aber auch diese ein .W1(P,Q)ED

Wenn die Varianz von endet sphärisch (zB wenn , , dann ist die Varianz von wird ), der ehemaligen Frage gibt die Antwort in Bezug auf ein verallgemeinertes Laguerre-Polynom.DΣx=σx2IΣy=σy2ID(σxσy)2I

Im Allgemeinen haben wir eine einfache obere Schranke für basierend auf Jensens Ungleichung, abgeleitet zB aus der ersten Frage: ED

(ED)2ED2=μxμy2+tr(Σx+ΣyAΣxΣxA)=μxμy2+tr(Σx)+tr(Σy)2tr(Σx12(Σx12ΣyΣx12)12Σx12)=μxμy2+tr(Σx)+tr(Σy)2tr((Σx12ΣyΣx12)12)=W2(P,Q)2.
Die Gleichheit am Ende ist, weil die Matrizen und ähnlich sind Sie haben also die gleichen Eigenwerte, und daher haben ihre Quadratwurzeln die gleiche Spur.ΣxΣyΣx12ΣyΣx12=Σx12(ΣxΣy)Σx12

Diese Ungleichung ist streng, solange nicht entartet ist, was in den meisten Fällen bei .DΣxΣy

Eine Vermutung : Vielleicht ist diese engere obere Schranke, , eng. ich hier lange Zeit eine andere Obergrenze, von der ich vermutete, dass sie enger war als die , also sollten Sie dieser Vermutung vielleicht nicht zu sehr vertrauen. :)EDW2

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.