Mit den Informationen von @Glen_b konnte ich die Antwort finden. Verwenden Sie die gleichen Notationen wie die Frage
P(Zk≤x)=∑j=0k+1(k+1j)(−1)j(1−jx)k+,
Dabei ist a+=a wenn a>0 und sonst 0 . Ich gebe auch die Erwartung und die asymptotische Konvergenz für die Gumbel- Distribution ( NB : nicht Beta) an
E(Zk)=1k+1∑i=1k+11i∼log(k+1)k+1,P(Zk≤x)∼exp(−e−(k+1)x+log(k+1)).
Das Material der Proofs stammt aus mehreren Veröffentlichungen, die in den Referenzen verlinkt sind. Sie sind etwas langwierig, aber unkompliziert.
1. Nachweis der genauen Verteilung
Sei IID gleichförmige Zufallsvariablen im Intervall . Indem wir sie bestellen, erhalten wir die mit bezeichneten Ordnungsstatistiken . Die einheitlichen Abstände sind definiert als , mit und . Die geordneten Abstände sind die entsprechenden geordneten Statistiken . Die interessierende Variable ist .(U1,…,Uk)(0,1)k(U(1),…,U(k))Δi=U(i)−U(i−1)U(0)=0U(k+1)=1Δ(1)≤…≤Δ(k+1)Δ(k+1)
Für festes definieren wir die Indikatorvariable . Aufgrund der Symmetrie ist der Zufallsvektor austauschbar, sodass die gemeinsame Verteilung einer Teilmenge der Größe der gemeinsamen Verteilung von entspricht der erste . Durch die Erweiterung des Produktes erhalten wir somitx∈(0,1)1i=1{Δi>x}(11,…,1k+1)jj
P(Δ(k+1)≤x)=E(∏i=1k+1(1−1i))=1+∑j=1k+1(k+1j)(−1)jE(∏i=1j1i).
Wir werden nun beweisen, dass , wodurch die oben angegebene Verteilung erstellt wird. Wir beweisen dies für , da der allgemeine Fall ähnlich bewiesen ist.E(∏ji=11i)=(1−jx)k+j=2
E(∏i=121i)=P(Δ1>x∩Δ2>x)=P(Δ1>x)P(Δ2>x|Δ1>x).
Wenn , liegen die Haltepunkte im Intervall . In diesem Fall sind die Haltepunkte noch austauschbar, sodass die Wahrscheinlichkeit, dass der Abstand zwischen dem zweiten und dem ersten Haltepunkt größer als ist, mit der Wahrscheinlichkeit identisch ist, dass der Abstand zwischen dem ersten Haltepunkt und der linken Barriere (an Position ) ist größer als . SoΔ1>xk(x,1)xxx
P(Δ2>x|Δ1>x)=P(all points are in (2x,1)∣∣all points are in (x,1)),soP(Δ2>x∩Δ1>x)=P(all points are in (2x,1))=(1−2x)k+.
2. Erwartung
Für Distributionen mit endlicher Unterstützung haben wir
E(X)=∫P(X>x)dx=1−∫P(X≤x)dx.
Durch Integration der Verteilung von erhalten wirΔ(k+1)
E(Δ(k+1))=1k+1∑j=1k+1(k+1j)(−1)j+1j=1k+1∑j=1k+11j.
Die letzte Gleichheit ist eine klassische Darstellung der harmonischen Zahlen , die wir unten demonstrieren.Hi=1+12+…+1i
Hk+1=∫101+x+…+xkdx=∫101−xk+11−xdx.
Mit der Änderung der Variablen und der Erweiterung des Produkts erhalten wiru=1−x
Hk+1=∫10∑j=1k+1(k+1j)(−1)j+1uj−1du=∑j=1k+1(k+1j)(−1)j+1j.
3. Alternative Konstruktion gleichmäßiger Abstände
Um die asymptotische Verteilung des größten Fragments zu erhalten, müssen wir eine klassische Konstruktion einheitlicher Abstände als Exponentialvariablen dividiert durch ihre Summe zeigen. Die Wahrscheinlichkeitsdichte der zugehörigen Ordnungsstatistik beträgt(U(1),…,U(k))
fU(1),…U(k)(u(1),…,u(k))=k!,0≤u(1)≤…≤u(k+1).
Wenn wir die gleichmäßigen Abstände , erhalten wir mitΔi=U(i)−U(i−1)U(0)=0
fΔ1,…Δk(δ1,…,δk)=k!,0≤δi+…+δk≤1.
Durch die Definition von wir alsoU(k+1)=1
fΔ1,…Δk+1(δ1,…,δk+1)=k!,δ1+…+δk=1.
Nun sei eine exponentielle IID-Zufallsvariable mit dem Mittelwert 1 und sei . Mit einer einfachen Änderung der Variablen können wir das sehen(X1,…,Xk+1)S=X1+…+Xk+1
fX1,…Xk,S(x1,…,xk,s)=e−s.
Definiere , so dass wir durch eine Änderung der Variablen erhaltenYi=Xi/S
fY1,…Yk,S(y1,…,yk,s)=ske−s.
Durch Integration dieser Dichte in Bezug auf wir alsos
fY1,…Yk,(y1,…,yk)=∫∞0ske−sds=k!,0≤yi+…+yk≤1,and thusfY1,…Yk+1,(y1,…,yk+1)=k!,y1+…+yk+1=1.
Die gemeinsame Verteilung von gleichmäßigen Abständen im Intervall ist also die gleiche wie die gemeinsame Verteilung von exponentiellen Zufallsvariablen geteilt durch ihre Summe. Wir kommen zur folgenden Äquivalenz der Verteilungk+1(0,1)k+1
Δ(k+1)≡X(k+1)X1+…+Xk+1.
4. Asymptotische Verteilung
Unter Verwendung der obigen Äquivalenz erhalten wir
P((k+1)Δ(k+1)−log(k+1)≤x)=P(X(k+1)≤(x+log(k+1))X1+…+Xk+1k+1)=P(X(k+1)−log(k+1)≤x+(x+log(k+1))Tk+1),
Dabei ist . Diese Variable verschwindet wahrscheinlich, weil und . Asymptotisch ist die Verteilung dieselbe wie die von . Weil die IID sind, haben wirTk+1=X1+…+Xk+1k+1−1E(Tk+1)=0Var(log(k+1)Tk+1)=(log(k+1))2k+1↓0X(k+1)−log(k+1)Xi
P(X(k+1)−log(k+1)≤x)=P(X1≤x+log(k+1))k+1=(1−e−x−log(k+1))k+1=(1−e−xk+1)k+1∼exp{−e−x}.
5. Grafische Übersicht
Das folgende Diagramm zeigt die Verteilung des größten Fragments für verschiedene Werte von . Für ich auch die asymptotische Gumbelverteilung (dünne Linie) überlagert. Das Gumbel ist eine sehr schlechte Näherung für kleine Werte von so dass ich sie weglasse, um das Bild nicht zu überladen. Die Gumbel-Näherung ist gut von .kk=10,20,50kk≈50
6. Referenzen
Die obigen Beweise sind den Referenzen 2 und 3 entnommen. Die zitierte Literatur enthält viel mehr Ergebnisse, wie die Verteilung der geordneten Abstände eines beliebigen Ranges, ihre Grenzverteilung und einige alternative Konstruktionen der geordneten gleichmäßigen Abstände. Die wichtigsten Verweise sind nicht leicht zugänglich, daher biete ich auch Links zum Volltext an.
- Bairamov et al. (2010) Grenzergebnisse für geordnete gleichmäßige Abstände , Stat. Papers, 51: 1, S. 227-240
- Holst (1980) Auf den Längen der zufällig gebrochenen Stockstücke beschreibt J. Appl. Prob., 17, S. 623–634
- Pyke (1965) Spacings , JRSS (B) 27: 3, S. 395-449
- Renyi (1953) Zur Theorie der Ordnungsstatistik , Acta math Hung, 4, S. 191-231