Was ist die erwartete Tiefe eines zufällig erzeugten Baumes?


19

Ich habe vor langer Zeit über dieses Problem nachgedacht, aber keine Ahnung davon.

Der Erzeugungsalgorithmus ist wie folgt. Wir nehmen an, dass es n diskrete Knoten gibt, die von 0 bis nummeriert sind n1. Dann machen wir für jedes i in das übergeordnete Element {1,,n1}des i ten Knotens im Baum zu einem zufälligen Knoten in {0,,i1} . Durchlaufen Sie jedes i , damit das Ergebnis ein zufälliger Baum mit dem Wurzelknoten 0 . (Vielleicht ist das nicht zufällig genug, aber das spielt keine Rolle.)

Was ist die erwartete Tiefe dieses Baumes?


Ich gehe davon aus, dass root ist und Sie sagen wollten: "Dann machen wir für jedes i in [ 1 , n ) das übergeordnete Element des i- ten Knotens ...". Recht? v0i[1,n)i
Ohne Titel

Was hast du versucht? Haben Sie versucht, eine Wiederholungsrelation zu schreiben, z. B. für die die erwartete Tiefe des Knotens i ist ? d(i)i
DW

3
Diese Objekte sind unter dem Namen "zufälliger rekursiver Baum" bekannt.
James Martin

Antworten:


15

Ich denke, es gibt ein Konzentrationsergebnis zu , aber ich habe die Details noch nicht ausgefüllt.elogn

Wir können eine obere Schranke für die Wahrscheinlichkeit erhalten , dass der Knoten hat d Vorfahren nicht einschließlich 0 . Für jede mögliche vollständige Kette von d Vorfahren ungleich Null ( a 1 , a 2nd0d ist die Wahrscheinlichkeit dieser Kette ( 1(ein1,ein2,...,eind) . Dies entspricht1(1a1)(1a2)(1ad)×1n mal ein Term von(1+11nwo die Bedingungen bestellt werden. Eine Obergrenze für diese Wahrscheinlichkeit ist also1(1+12+13+1n1)d wobeiHn-1dien-1.Harmonische Nr.1+1 ist1n(d!)Hn1dHn1n1 . Hn-1log(n-1)+γ. Für festesdundnbeträgtdie Wahrscheinlichkeit, dass sich der Knotennin der Tiefed+1befindet, höchstens1+12+...+1n1Hn1log(n1)+γdnnd+1

(logn)dn(d!)(1+o(1))

Durch die Annäherung von Stirling können wir das als schätzen

1n2πd(elognd)d.

Für großes , alles, was viel größer als e log n ist , ist die Basis des Exponentials klein, daher ist diese Grenze klein, und wir können die Vereinigungsgrenze verwenden, um zu sagen, dass die Wahrscheinlichkeit, dass es mindestens einen Knoten mit d Vorfahren ungleich Null gibt, gleich ist klein.delognd


Sehen

Luc Devroye, Omar Fawzi, Nicolas Fraiman. "Tiefeneigenschaften von zufälligen rekursiven Bäumen mit skaliertem Anhang."

B. Pittel. Beachten Sie die Höhen von zufälligen rekursiven Bäumen und zufälligen Suchbäumen. Random Structures and Algorithms, 5: 337–348, 1994.

Die ersteren Behauptungen, die letzteren zeigten, dass die maximale Tiefe mit hoher Wahrscheinlichkeit ist, und bieten einen weiteren Beweis.(e+o(1))logn


2
Sehr schön. Zur Verdeutlichung für andere Leser: Da Sie ein nicht wiederholen können , wird der Term ( 1 + 1aiist nur eine Obergrenze. (1+12++1n1)d
Peter Shor

3

This question was answered several years back, but, just for fun, here is a simple proof of the upper bound. We give a bound on the expectation, then a tail bound.

Define r.v. di to be the depth of node i{0,1,,n1}. Define ϕi=j=0iedj.

lemma 1. The expected maximum depth, E[maxidi] is at most eHn1.

Proof. The maximum depth is at most lnϕn1. To finish we show E[lnϕn1]eHn1.

i1ϕi1ϕi

E[ϕi|ϕi1]=ϕi1+E[edi]=ϕi1+eiϕi1=(1+ei)ϕi1.

By induction it follows that

E[ϕn1]=i=1n1(1+ei)<i=1n1exp(ei)=exp(eHn1).

So, by the concavity of the logarithm,

E[lnϕn1]lnE[ϕn1]<lnexp(eHn1)=eHn1.       

Here is the tail bound:

lemma 2. Fix any c0. Then Pr[maxidi]eHn1+c is at most exp(c).

Proof. By inspection of ϕ, and the Markov bound, the probability in question is at most

Pr[ϕn1exp(eHn1+c)]E[ϕn1]exp(eHn1+c).
From the proof of Lemma 1, E[ϕn1]exp(eHn1). Substituting this into the right-hand side above completes the proof.   

As for a lower bound, I think a lower bound of (e1)HnO(1) follows pretty easily by considering maxidilnϕtlnn. But... [EDIT: spoke too soon]

It doesn't seem so easy to show the tight lower bound, of (1o(1))eHn...


2

I have actually thought about the same question (although in a completely different formulation) a few months ago, as well as some close variants.

I don't have a closed form (/ asymptotic) solution for it, but you might find this view useful (are you only looking for upper bound perhaps?).

The process you describe here is a generalization of the Chinese Restaurant Process, where each "table" is a subtree whose root's parent is v0.

This also gives us a recursion formula for your question.

Denote by h(n) the expected heights of a such tree process with n nodes.

Denote by Pn(B)=ΠbB(b1)!n! (the probability of distribution B of the nodes into subtrees).

Then the quantity you're looking for, h(n), is given by:

h(n)=BBnPn(B)maxbBh(b)

If you wish to code this recursion, make sure you use the following so it won't go into infinite loop:

h(n)=BBn{{n}}Pn(B)maxbBh(b)11n!

Where Bn is the set of all partitions of n identical balls into any number of non-empty bins, and h(1)=1.


In practice, when I needed this I just used a simple monte-carlo method for estimating h(n), as trying to actually compute h by this method is extremely inefficient.


1
Thanks for the idea! Actually I wrote a monte-carlo program the first time when I met with this problem, but to my surprise the accurate result is so difficult to get.
zhxchen17
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.