Wir können dieses Problem mithilfe einiger geometrischer Intuition und Argumente analytisch lösen . Leider ist die Antwort ziemlich lang und etwas chaotisch.
Grundeinstellung
Lassen Sie uns zunächst eine Notation festlegen. Angenommen, wir zeichnen Punkte gleichmäßig zufällig aus dem Rechteck . Wir nehmen ohne Verlust der Allgemeinheit an, dass . Sei die Koordinate des ersten Punktes und die Koordinate des zweiten Punktes. Dann sind , , und voneinander unabhängig, wobei gleichmäßig auf und gleichmäßig auf .[0,a]×[0,b]0<b<a(X1,Y1)(X2,Y2)X1X2Y1Y2Xi[0,a]Yi[0,b]
Betrachten Sie den euklidischen Abstand zwischen den beiden Punkten. Dies ist
wobeiund.Z 1 = | X 1 - X 2 | Z 2 = | Y 1 - Y 2 |
D=(X1−X2)2+(Y1−Y2)2−−−−−−−−−−−−−−−−−−−√=:Z21+Z22−−−−−−−√,
Z1=|X1−X2|Z2=|Y1−Y2|
Dreiecksverteilungen
Da und unabhängige Uniformen sind, hat eine dreieckige Verteilung, woraushat eine Verteilung mit der Dichtefunktion
Die entsprechende Verteilungsfunktion ist für . In ähnlicher Weise isthat die Dichte und die Verteilungsfunktion .X 2 X 1 - X 2 Z 1 = | X 1 - X 2 | f a ( z 1 ) = 2X1X2X1−X2Z1=|X1−X2|F a (
fa(z1)=2a2(a−z1),0<z1<a.
0 ≤ z 1 ≤ a Z 2 = | Y 1 - Y 2 | f b ( z 2 ) F b ( z 2 )Fa(z1)=1−(1−z1/a)20≤z1≤aZ2=|Y1−Y2|fb(z2)Fb(z2)
Beachten Sie, dass seit eine Funktion nur von den beiden ist und ist nur eine Funktion der , dann und sind unabhängig. Der Abstand zwischen den Punkten ist also die euklidische Norm zweier unabhängiger Zufallsvariablen (mit unterschiedlichen Verteilungen).X i Z 2 Y i Z 1 Z 2Z1XiZ2YiZ1Z2
Das linke Feld der Abbildung zeigt die Verteilung von und das rechte Feld zeigtDabei ist in diesem Beispiel.Z 1 = | X 1 - X 2 | a = 5X1−X2Z1=|X1−X2|a=5
Eine geometrische Wahrscheinlichkeit
So und sind unabhängig und werden auf unterstützte und ist. Für festes lautet die Verteilungsfunktion des euklidischen Abstands
Z1Z2[0,a][0,b]d
P(D≤d)=∬{z21+z22≤d2}fa(z1)fb(z2)dz1dz2.
Wir können uns dies geometrisch als eine Verteilung auf dem Rechteck und einen Viertelkreis mit dem Radius . Wir möchten die Wahrscheinlichkeit kennen, die innerhalb des Schnittpunkts dieser beiden Regionen liegt. Es gibt drei verschiedene Möglichkeiten:d[0,a]×[0,b]d
Region 1 (orange): . Hier liegt der Viertelkreis vollständig innerhalb des Rechtecks.0≤d<b
Region 2 (rot): . Hier schneidet der Viertelkreis den Rechteck entlang der Ober- und Unterkante.b≤d≤a
Region 3 (blau): . Der Viertelkreis schneidet das Rechteck am oberen und rechten Rand.a<d≤a2+b2−−−−−−√
Hier ist eine Abbildung, in der wir einen Beispielradius für jeden der drei Typen zeichnen. Das Rechteck ist definiert durch , . Die Graustufen-Heatmap innerhalb des Rechtecks zeigt die Dichte wobei dunkle Bereiche eine höhere Dichte und hellere Bereiche eine geringere Dichte aufweisen. Durch Klicken auf die Abbildung wird eine größere Version davon geöffnet.b = 4 f a ( z 1 ) f b ( z 2 )a=5b=4fa(z1)fb(z2)dz1dz2
Ein hässlicher Kalkül
Um die Wahrscheinlichkeiten zu berechnen, müssen wir einige Berechnungen durchführen. Betrachten wir nacheinander jede Region und sehen, dass ein gemeinsames Integral entsteht. Dieses Integral hat eine geschlossene Form, obwohl es nicht sehr hübsch ist.
Region 1 : .0≤d<b
P(D≤d)=∫d0∫d2−y2√0fb(y)fa(x)dxdy=∫d0fb(y)∫d2−y2√0fa(x)dxdy.
Das innere Integral ergibt nun . Wir müssen also ein Integral der Form berechnen
wobei in diesem Fall von Interesse . Das Antiderivativ des Integranden ist
1a2d2−y2−−−−−−√(2a−d2−y2−−−−−−√)
G(c)−G(0)=∫c0(b−y)d2−y2−−−−−−√(2a−d2−y2−−−−−−√)dy,
c=dG(y)=∫(b−y)d2−y2−−−−−−√(2a−d2−y2−−−−−−√)dy=a3d2−y2−−−−−−√(y(3b−2y)+2d2)+abd2tan−1(yd2−y2√)−bd2y+by33+(dy)22−y44.
Daraus ergibt sich .P(D≤d)=2a2b2(G(d)−G(0))
Region 2 : .b≤d≤a
P(D≤d)=2a2b2(G(b)−G(0)),
nach den gleichen Überlegungen wie für Region 1, außer dass wir jetzt integrieren müssen entlang der Achse bis nach statt nur .
ybd
Region 3 : .
a<d≤a2+b2−−−−−−√
P(D≤d)=∫d2−a2√0fb(y)dy+∫bd2−a2√fb(y)∫d2−y2√0fa(x)dxdy=Fb(d2−a2−−−−−−√)+2a2b2(G(b)−G(d2−a2−−−−−−√))
Im Folgenden finden Sie eine Simulation von 20000 Punkten, in der wir die empirische Verteilung als graue Punkte und die theoretische Verteilung als Linie darstellen, die entsprechend der jeweiligen Region gefärbt ist.
Aus derselben Simulation zeichnen wir unten die ersten 100 Punktepaare und zeichnen Linien zwischen ihnen. Jedes ist entsprechend dem Abstand zwischen dem Punktpaar und dem Bereich, in den dieser Abstand fällt, gefärbt.
Die erwartete Anzahl von Punktpaaren innerhalb des Abstands ist einfach
durch Linearität der Erwartung.E [ ξ ] = ( nd
E[ξ]=(n2)P(D≤d),
probability
.