Ich werde für meine früheren Fehler zu büßen versuchen , durch etwas gegenüber zeigt - , dass Proben sind ausreichend (die Untergrenze von1/ϵ2ist fast eng)! Sehen Sie, was Sie denken ...Θ~( 1ϵ2)1 / ϵ2
Die Schlüsselintuition geht von zwei Beobachtungen aus. Erstens müssen Verteilungen mit hoher Wahrscheinlichkeit ( Ω ( ϵ 2 ) ) vorhanden sein , damit Verteilungen einen -Abstand von ϵ haben . Wenn wir zum Beispiel 1 / ϵ 3 Wahrscheinlichkeitspunkte ϵ 3 hätten , hätten wir ‖ D 1 - D 2 ‖ 2 ≤ √L.2ϵΩ(ϵ2)1/ϵ3ϵ3.∥D1−D2∥2≤1ϵ3(ϵ3)2−−−−−−√=ϵ3/2<ϵ
Zweitens betrachten wir Gleichverteilungen mit einem -Distanz von ϵ . Wenn wir O ( 1 ) Wahrscheinlichkeitspunkte O ( 1 ) hätten , würden sie sich jeweils um O ( ϵ ) unterscheiden und 1 / ϵ 2 Stichproben würden ausreichen. Wenn wir dagegen O ( 1 / ϵ 2 ) Punkte hätten, müssten sie sich jeweils um O ( ϵ 2 ) und erneut um O ( 1 /) unterscheidenL2ϵO(1)O(1)O(ϵ)1/ϵ2O(1/ϵ2)O(ϵ2) Stichproben (eine konstante Anzahl pro Punkt) reichen aus. Wir können also hoffen, dass es unter den zuvor erwähnten Punkten mit hoher Wahrscheinlichkeit immer einen Punkt gibt, der sich "genug" unterscheidet, dass O ( 1 / ϵ 2 ) ihn zeichnet.O(1/ϵ2)O(1/ϵ2)
Algorithmus. Bei und einem Konfidenzparameter M sei X = M log ( 1 / ϵ 2 ) . Zeichne X.ϵMX=Mlog(1/ϵ2) Proben aus jeder Verteilung. Seiai,bidie jeweils höhere, niedrigere Anzahl von Abtastwerten für Punkti. Wenn es einen Punkti∈[n] gibt,für denai≥X istXϵ2ai,biii∈[n] undai-bi≥√ai≥X8 , deklarieren Sie die Verteilungen unterschiedlich. Andernfalls deklarieren Sie sie gleich.ai−bi≥ai−−√X√4
Die Korrektheits- und Konfidenzgrenzen ( ) hängen vom folgenden Lemma ab, das besagt, dass die gesamte Abweichung in der L 2 -Distanz von Punkten stammt, deren Wahrscheinlichkeiten sich um Ω ( ϵ 2 ) unterscheiden .1−e−Ω(M)L2Ω(ϵ2)
Anspruch. Angenommen, . Sei δ i = | D 1 ( i ) - D 2 ( i ) | . Sei S k = { i : δ i > ϵ 2∥D1−D2∥2≥ϵδi=|D1(i)−D2(i)|. Dann ist
∑i∈ S k δ 2 i ≥ϵ2(1-2)Sk={i:δi>ϵ2k}
∑i∈Skδ2i≥ϵ2(1−2k).
Beweis . Wir haben
Lassen Sie uns die zweite Summe binden; wir wollen ∑ i ∉ S k δ 2 i maximieren, vorbehaltlich ∑ i ∉ S k δ i ≤ 2 . Da die Funktion x ↦ x 2 streng konvex ist und zunimmt, können wir das Ziel erhöhen, indem wir ein beliebiges δ nehmen
∑i∈Skδ2i + ∑i∉Skδ2i≥ϵ2.
∑i∉Skδ2i∑i∉Skδi≤2x↦x2 und Erhöhen von
δ i um
γ, während
δ j um
γ verringertwird. Somit wird das Ziel mit so vielen Termen wie möglich bei ihren Maximalwerten und der Rest bei
0 maximiert. Der Maximalwert jedes Terms ist
ϵ 2δi≥δjδiγδjγ0 , und es gibt höchstens
2kϵ2k Terme dieses Wertes (da sie höchstens
2 ergeben). Also
∑i∉Skδ 2 i ≤2k2kϵ22∑i∉Skδ2i≤2kϵ2(ϵ2k)2=2ϵ2k. □
Anspruch . Sei . Wenn ‖ D 1 - D 2 ‖ 2 ≥ ϵ ist , existiert mindestens ein Punkt i ∈ [ n ] mit p i > ϵ 2pi=max{D1(i),D2(i)}∥D1−D2∥2≥ϵi∈[n] undδi≥ϵ √pi>ϵ24 .δi≥ϵpi√2
Skpi≥δi>ϵ2kSkk>2
∑ipi≤2
∑i∈Skδ2i≥ϵ2(12−1k)∑i∈Skpi,
∑i∈Sk(δ2i−piϵ2(12−1k))≥0,
δ2i≥piϵ2(12−1k)
Skk=4□
D1=D2e−Ω(M)
pi<ϵ2/16pi≥ϵ2/16iX/8<X/16e−Ω(X/pi)=ϵ2e−Ω(M/pi)iX/16pi
pi≥ϵ2/16mppmcpm−−−√e−Ω((cpm√)2/pm)=e−Ω(c2)c=X√16e−Ω(X)=ϵ2e−Ω(M)
1−ϵ2e−Ω(M)ipiXϵ2−−−−√X√16piXϵ216/ϵ2□
∥D1−D2∥2≥ϵϵ2e−Ω(M)
ipi>ϵ2/4δi≥ϵpi−−√/21−ϵ2e−Ω(M)ipimpim−−−√X√161pi=D1(i)=D2(i)+δii2
ipiXϵ2−−−√X√16δi
Xϵ2δi≥Xpi−−√2ϵ=piXϵ2−−−−√X−−√2.
i#samples(1)−−−−−−−−−−−√X√4□
Mi#samples−−−−−−−−√mean−−−−−√