Balls and Bins-Analyse im m >> n-Regime.

Es ist allgemein bekannt, dass der am meisten geladene Behälter mit hoher Wahrscheinlichkeit $O(\log n)$ Bälle enthält , wenn Sie n Bälle in n Behälter werfen . Im Allgemeinen kann man nach $m > n$ Bällen in $n$ Behältern fragen . Eine Veröffentlichung von RANDOM 1998 von Raab und Steger untersucht dies im Detail und zeigt, dass mit zunehmendem $m$ die Wahrscheinlichkeit, den erwarteten Wert von ein wenig zu $m/n$ überschreiten, rapide abnimmt. Grob gesagt zeigen sie mit $r = m/n$ , dass die Wahrscheinlichkeit mehr als $r + \sqrt{r\log n}$ ist. $o(1)$

Dieses Papier erschien 1998 und ich habe nichts neueres gefunden. Gibt es neue und noch konzentriertere Ergebnisse in dieser Richtung, oder gibt es heuristische / formale Gründe für den Verdacht, dass dies das Beste ist, was man bekommen kann? Ich sollte hinzufügen, dass ein verwandter Artikel über die 2006 von Angelika Steger mitverfasste Multiple-Choice-Variante auch keine neueren Arbeiten zitiert.

Update : Lassen Sie mich als Antwort auf Peters Kommentar die Dinge klarstellen, die ich wissen möchte. Ich habe hier zwei Ziele.

Erstens muss ich wissen, welcher Verweis zu zitieren ist, und es scheint, dass dies die jüngste Arbeit dazu ist.
Zweitens stimmt es, dass das Ergebnis im Bereich von r = 1 ziemlich eng ist. Ich interessiere mich für den Bereich m >> n und speziell für den Bereich, in dem r poly log n oder sogar n ^ c sein könnte. Ich versuche, dieses Ergebnis in ein Lemma einzufügen, das ich beweise, und die spezifische Grenze für r steuert andere Teile des Gesamtalgorithmus. Ich denke (bin mir aber nicht sicher), dass der in diesem Artikel angegebene Bereich für r ausreicht, aber ich wollte nur sicherstellen, dass es keine engere Grenze gibt (was zu einem besseren Ergebnis führen würde).

reference-request pr.probability

— Suresh Venkat
quelle

Ich habe den Namen „Belegungsproblem“ aus dem Tag gelernt. Vielen Dank, dass Sie eine pädagogische Frage gestellt haben. :)

— Tsuyoshi Ito

Wenn ich mir das Papier von Raab und Steger anschaue, fällt es mir schwer, herauszufinden, welche weiteren Ergebnisse Sie in diesem Sinne wünschen würden. Gibt es eine bestimmte Frage, auf die Sie die Antwort wissen müssen? Wenn ja, sollten Sie es hier oder auf MathOverflow fragen. Insbesondere wenn

, geben Raab und Steger eine enge Grenze von

r = m / n

$r=m/n$

wobei

die richtige Konstante ist.

r + \sqrt{2 r \log n}

$r + \sqrt{2r \log n}$

2

$2$

— Peter Shor

@ Peter Ich bearbeite die Frage: Es ist ein gültiger Punkt.

— Suresh Venkat

Keine vollständige Antwort (noch eine nützliche Referenz), sondern nur ein ausführlicher Kommentar. Für jeden gegebenen Behälter wird die Wahrscheinlichkeit, dass sich genau $B$ Bälle im Behälter befinden, durch . Wir können eine Ungleichung aufgrund von Sondow verwenden, $p_B = \binom{m}{B} \left(\frac{1}{n}\right)^B \left(\frac{n-1}{n}\right)^{m-B}$ , um $\binom{(b+1)a}{a}<\left(\frac{(b+1)^{b+1}}{b^b}\right)^a$ , wobei $p_B < \left(\frac{(r+1)^{r+1}}{r^r}\right)^B \left(\frac{1}{n}\right)^B \left(\frac{n-1}{n}\right)^{m-B}$ . Beachten Sie, dass diese Grenze ziemlich eng ist, da a $r=\frac{m}{B}-1$ . $\binom{(b+1)a}{a}>\frac{1}{4ab}\left(\frac{(b+1)^{b+1}}{b^b}\right)^a$

Somit haben wir . Da Sie nun an der Wahrscheinlichkeit interessiert sind, oder mehr Bälle in einem Behälter zu finden, können wir $p_B < e^{B(r+1)\ln(r+1) - Br\ln r - m\ln n + (m-B)\ln (n-1)}$ $B$ . Wenn wir die Terme neu ordnen, erhalten wir $p_{\geq B} = \sum_{b=B}^{m} p_b < \sum_{b=B}^{m} e^{b(r+1)\ln(r+1) - br\ln r - m\ln n + (m-b)\ln (n-1)}$

p_{\geq B} < e^{- m \ln \frac{n}{n - 1}} \times e^{B (r + 1) \ln (r + 1) - B r \ln r - B \ln (n - 1)} \sum_{b = 0}^{m - B} e^{b (r + 1) \ln (r + 1) - b r \ln r - b \ln (n - 1)} .

$p_{\geq B} < e^{-m\ln \frac{n}{n-1}} \times e^{B(r+1)\ln(r+1) - Br\ln r - B\ln (n-1)} \sum_{b=0}^{m-B} e^{b(r+1)\ln(r+1) - br\ln r - b\ln (n-1)}.$

Beachten Sie, dass die obige Summierung lediglich eine geometrische Reihe ist, sodass wir diese vereinfachen können, um Wenn wirumschreiben

p_{\geq B} < e^{- m \ln \frac{n}{n - 1}} \times e^{B (r + 1) \ln (r + 1) - B r \ln r - B \ln (n - 1)} \times \frac{1 - {(\frac{(r + 1)^{r + 1}}{r^{r} (n - 1)})}^{m - B + 1}}{1 - (\frac{(r + 1)^{r + 1}}{r^{r} (n - 1)})} .

$p_{\geq B} < e^{-m\ln \frac{n}{n-1}} \times e^{B(r+1)\ln(r+1) - Br\ln r - B\ln (n-1)} \times \frac{1-\left(\frac{(r+1)^{r+1}}{r^r (n-1)}\right)^{m-B+1}}{1-\left(\frac{(r+1)^{r+1}}{r^r (n-1)}\right)}.$

Terme mit Exponentialen erhalten wir

\frac{(r + 1)^{r + 1}}{r^{r} (n - 1)}

$\frac{(r+1)^{r+1}}{r^r (n-1)}$

p_{\geq B} < e^{- m \ln \frac{n}{n - 1}} \times e^{B (r + 1) \ln (r + 1) - B r \ln r - B \ln (n - 1)} \times \frac{1 - {(e^{(r + 1) \ln (r + 1) - r \ln r - \ln (n - 1)})}^{m - B + 1}}{1 - e^{(r + 1) \ln (r + 1) - r \ln r - \ln (n - 1)}},

$p_{\geq B} < e^{-m\ln \frac{n}{n-1}} \times e^{B(r+1)\ln(r+1) - Br\ln r - B\ln (n-1)} \times \frac{1-\left(e^{(r+1)\ln (r+1) - r \ln r - \ln(n-1)}\right)^{m-B+1}}{1-e^{(r+1)\ln (r+1) - r \ln r - \ln(n-1)}},$

p_{\geq B} < \frac{e^{- m \ln \frac{n}{n - 1}} \times (e^{B ((r + 1) \ln (r + 1) - r \ln r - \ln (n - 1))} - e^{(m + 1) ((r + 1) \ln (r + 1) - r \ln r - \ln (n - 1))})}{1 - e^{(r + 1) \ln (r + 1) - r \ln r - \ln (n - 1)}} .

$p_{\geq B} < \frac{e^{-m\ln \frac{n}{n-1}} \times \left(e^{B((r+1)\ln(r+1) - r\ln r - \ln (n-1))} -e^{(m+1)((r+1)\ln (r+1) - r \ln r - \ln(n-1))}\right)}{1-e^{(r+1)\ln (r+1) - r \ln r - \ln(n-1)}}.$

Now, I take it you care about finding some $B$ such that $p_{\geq B} < \frac{C}{n}$ for some constant $C$ , since this gives the total probability of any bin having $B$ or more balls as bounded from above by $C$ . This criteria is satisfied by taking

\frac{e^{- m \ln \frac{n}{n - 1}} \times (e^{B ((r + 1) \ln (r + 1) - r \ln r - \ln (n - 1))} - e^{(m + 1) ((r + 1) \ln (r + 1) - r \ln r - \ln (n - 1))})}{1 - e^{(r + 1) \ln (r + 1) - r \ln r - \ln (n - 1)}} = \frac{C}{n},

$\frac{e^{-m\ln \frac{n}{n-1}} \times \left(e^{B((r+1)\ln(r+1) - r\ln r - \ln (n-1))} -e^{(m+1)((r+1)\ln (r+1) - r \ln r - \ln(n-1))}\right)}{1-e^{(r+1)\ln (r+1) - r \ln r - \ln(n-1)}} = \frac{C}{n},$ which can be rewritten as

B = \frac{\ln (\frac{C}{n} e^{m \ln \frac{n}{n - 1}} (1 - e^{(r + 1) \ln (r + 1) - r \ln r - \ln (n - 1)}) + e^{(m + 1) ((r + 1) \ln (r + 1) - r \ln r - \ln (n - 1))})}{(r + 1) \ln (r + 1) - r \ln r - \ln (n - 1)} .

$B = \frac{\ln\left(\frac{C}{n} e^{m\ln \frac{n}{n-1}} \left(1-e^{(r+1)\ln (r+1) - r \ln r - \ln(n-1)}\right) + e^{(m+1)((r+1)\ln (r+1) - r \ln r - \ln(n-1))}\right)}{(r+1)\ln(r+1) - r\ln r - \ln (n-1)}.$

I'm not entirely sure how useful this comment will be to you (it's entirely possible I've made a mistake somewhere), but hopefully it can be of some use.

— Joe Fitzsimons
quelle

this is pretty awesome. thanks for the outline.

— Suresh Venkat

@Suresh: Glad it's useful.

— Joe Fitzsimons