Zeichnen Sie zufällig Intervalle aus , wobei jeder Endpunkt A, B aus der gleichmäßigen Verteilung zwischen .
Wie groß ist die Wahrscheinlichkeit, dass sich mindestens ein Intervall mit allen anderen überschneidet?
Zeichnen Sie zufällig Intervalle aus , wobei jeder Endpunkt A, B aus der gleichmäßigen Verteilung zwischen .
Wie groß ist die Wahrscheinlichkeit, dass sich mindestens ein Intervall mit allen anderen überschneidet?
Antworten:
In diesem Beitrag wird die Frage beantwortet und ein Teil der Fortschritte bei der Prüfung der Richtigkeit beschrieben.
Für ist die Antwort trivial 1 . Für alle größeren n ist es ( überraschend) immer 2 / 3 .
Um zu sehen, warum, stellen Sie zunächst fest, dass die Frage auf jede stetige Verteilung (anstelle der gleichmäßigen Verteilung) verallgemeinert werden kann . Der Prozess, durch den die n Intervalle erzeugt werden, entspricht dem Zeichnen von 2 n iid, das X 1 , X 2 , ... , X 2 n von F abweicht und die Intervalle bildet
Da alle des X i unabhängig sind, sind sie austauschbar. Dies bedeutet, dass die Lösung dieselbe wäre, wenn wir alle zufällig permutieren würden. Bedingen wir also die durch Sortieren des X i erhaltene Ordnungsstatistik :
(Wo, weil stetig ist, gibt es keine Chance, dass zwei gleich sind). Die n Intervalle werden gebildet, indem eine zufällige Permutation σ ∈ S 2 n ausgewählt und paarweise verbunden werden
Ob sich zwei davon überlappen oder nicht, hängt nicht von den Werten von , da die Überlappung durch irgendeine monotone Transformation erhalten bleibt und es solche Transformationen gibt, die X ( i ) zu i senden . Ohne Verlust der Allgemeinheit können wir also X ( i ) = i nehmen und die Frage lautet:
Die Menge sei in n disjunkte Dubletten unterteilt. Zwei beliebige von ihnen, { l 1 , r 1 } und { l 2 , r 2 } (mit l i < r i ), überlappen sich, wenn r 1 > l 2 und r 2 > l 1. Angenommen, eine Partition ist "gut", wenn mindestens eines ihrer Elemente alle anderen überlappt (und ansonsten "schlecht" ist). Wie hoch ist der Anteil guter Partitionen in Abhängigkeit von ?
Betrachten Sie zur Veranschaulichung den Fall . Es gibt drei Partitionen,
von denen die zwei guten (die zweite und die dritte) rot gefärbt sind. Somit ist die Antwort im Fall ist 2 / 3 .
Wir können solche Partitionen grafisch darstellen durch die Punkte Plotten { 1 , 2 , ... , 2 n } auf einer Zahlengeraden und Zeichenliniensegmente zwischen jedem L i und r i ,verschmieren sie leicht visuelle Überlappungen zu lösen. Hier sind Diagramme der vorhergehenden drei Partitionen in derselben Reihenfolge mit derselben Färbung:
Von nun an drehe ich sie zur Seite, um solche Zeichnungen in dieses Format zu integrieren. Zum Beispiel sind hier die Partitionen für n = 3 , noch einmal mit den guten, die rot gefärbt sind:
Zehn gut sind, so ist die Antwort für ist , 10 / 15 = 2 / 3 .
Die erste interessante Situation tritt auf, wenn . Jetzt ist es zum ersten Mal möglich, dass die Vereinigung der Intervalle 1 bis 2 n umfasst, ohne dass eines der Intervalle die anderen schneidet. Ein Beispiel ist { { 1 , 3 } , { 2 , 5 } , { 4 , 7 } , { 6 , 8 } } . Die Vereinigung der Liniensegmente verläuft ungebrochen von 1 bis 8Dies ist jedoch keine gute Partition. Trotzdem der 105 Partitionen sind gut und der Anteil bleibt 2 / 3 .
Die Anzahl der Partitionen steigt mit rapide an : Sie entspricht 1 ⋅ 3 ⋅ 5 ⋯ ⋅ 2 n - 1 = ( 2 n ) ! / ( 2 n n ! ) . Erschöpfende Aufzählung aller Möglichkeiten durch n = 7 weiterhin ergeben 2 / 3 als Antwort. Monte-Carlo-Simulationen mit n = 100 (jeweils 10000 Iterationen) zeigen keine signifikanten Abweichungen von 2 .
Ich bin überzeugt, dass es eine clevere und einfache Methode gibt, um zu demonstrieren, dass es immer ein Verhältnis zwischen guten und schlechten Partitionen gibt, aber ich habe keine gefunden. Ein Beweis ist durch sorgfältige Integration (unter Verwendung der ursprünglichen Gleichverteilung des X i ) verfügbar , aber er ist ziemlich kompliziert und nicht aufschlussreich.