Intro Wie @vqv erwähnte Total Variation und Kullback Leibler sind zwei interessante Entfernungen. Der erste ist sinnvoll, da er in direktem Zusammenhang mit Fehlern des ersten und zweiten Typs beim Testen von Hypothesen stehen kann. Das Problem mit der Gesamtvariationsentfernung besteht darin, dass die Berechnung schwierig sein kann. Die Kullback Leibler Distanz ist einfacher zu berechnen und ich werde später darauf zurückkommen. Es ist nicht symetrisch, kann aber symetrisch gemacht werden (irgendwie ein bisschen künstlich).
Antwort Etwas, das ich hier erwähne , ist, dass, wenn das logarithmische Wahrscheinlichkeitsverhältnis zwischen Ihren beiden Gaußschen Maßen P 0 , P 1 (sagen wir, dass für i = 0 , 1 P i den Mittelwert μ i und die Kovarianz C i hat ), das Fehlermaß ebenfalls überschneidet (im Gaußschen Fall fand ich es eigentlich ganz zentral) istLP0,P1i=0,1 PiμiCi
∥L∥2L2(P1/2)
für ein gut gewähltes .P1/2
In einfachen Worten :
- Es kann verschiedene interessante "Richtungs" -Rotationen geben, die unter Verwendung Ihrer Formel mit einer der definierten "interpolierten" Kovarianzmatrizen ( oder ) erhalten werden am Ende dieses Beitrags (die Nummer ist die, die Sie in Ihrem Kommentar zu Ihrer Frage vorschlagen). i = 1 , 2 , 3. , 4 5 5Σ=Ci,1/2i=1,2,3,455
- Da Ihre beiden Verteilungen unterschiedliche Kovarianzen aufweisen, reicht es nicht aus, die Mittelwerte zu vergleichen . Sie müssen auch die Kovarianzen vergleichen.
Lassen Sie mich Ihnen erklären, warum dies mein Gefühl ist, wie Sie dies im Fall von berechnen können und wie Sie wählen .P 1 / 2C1≠C0P1/2
Linearer Fall Wenn .C1=C0=Σ
σ=ΔΣ−1Δ=∥2L∥2L2(P1/2)
wobei die "Interpolation" zwischen und (Gauß mit Kovarianz und Mittelwert ). Beachten Sie, dass in diesem Fall der Hellinger-Abstand, der gesamte Variationsabstand, alle mit geschrieben werden kann . P 1 P 0 Σ ( μ 1 + μ 0 ) / 2 σP1/2P1P0Σ(μ1+μ0)/2σ
So berechnen Sie im allgemeinen FallL Eine natürliche Frage, die sich aus Ihrer (und meiner ) Frage ergibt, ist, was eine natürliche "Interpolation" zwischen und wenn . Hier kann das Wort natürlich benutzerspezifisch sein, aber es kann zum Beispiel mit der besten Interpolation zusammenhängen, eine enge Obergrenze mit einem anderen Abstand zu haben (z. B. Abstand hier ) P 1 P 0 C 1 ≠ C 0 L 1P1P0C1≠C0L1
Schreiben
( ) kann helfen, , wo sich die Interpolationsaufgabe befindet, aber:
L=ϕ(C−1/2i(x−μi))−ϕ(C−1/2j(x−μj))−12log(CiC−j)
i=0,j=1
L(x)=−12⟨Aij(x−sij),x−sij⟩Rp+⟨Gij,x−sij⟩Rp−cij,[1]
mit
Aij=C−i−C−j,Gij=Sijmij,Sij=C−i+C−j2,
cij=18⟨Aijmij,mij⟩Rp+12log|det(C−jCi)|
und
mij=μi−μjandsij=μi+μj2
ist für Rechenzwecke relevanter. Für jedes Gaußsche mit dem Mittelwert und der Kovarianz die Berechnung von aus Gleichung etwas technisch aber fassbar. Sie können es auch verwenden, um die Kulback-Leibler-Entfernung zu berechnen.P1/2s01C∥L∥2L2(P1/2)1
Welche Interpolation sollten wir wählen (dh wie man wählt ) ?P1/2
Aus Gleichung geht klar hervor, dass es im "quadratischen" Fall viele verschiedene Kandidaten für (Interpolation) gibt. Die beiden Kandidaten, die ich als "am natürlichsten" (subjektiv :) ergeben sich aus der Definition einer Verteilung mit dem Mittelwert für :1P1/2t∈[0,1]Pttμ1+(1−t)μ0
- ξ t = tP1t als Verteilung von (wobei aus ) mit der Kovarianz ).
ξt=tξ1+(1−t)ξ0
ξiPi i=0,1Ct,1=(tC1/21+(1−t)C1/20)2
- P2t mit inverser KovarianzC−1t,2=tC−11+(1−t)C−10
- P3t mit KovarianzCt,3=tC1+(1−t)C0
- C - 1 t , 4 = ( t C - 1 / 2 1 + ( 1 - t ) C - 1 / 2 0 ) 2P4t mit inverser KovarianzC−1t,4=(tC−1/21+(1−t)C−1/20)2
BEARBEITEN: Derjenige, den Sie in einem Kommentar zu Ihrer Frage vorschlagen, könnte , warum nicht ...Ct,5=Ct1C1−t0
Ich habe meine Lieblingswahl, die nicht die erste ist :) Ich habe nicht viel Zeit, um das hier zu diskutieren. Vielleicht bearbeite ich diese Antwort später ...