Was ist das stärkste Ergebnis über das Maximum der iid Gaußschen? Am häufigsten in der Praxis eingesetzt?


9

Berücksichtigen Sie bei X1,,Xn,N(0,1) iid die Zufallsvariablen

Zn:=max1inXi.

Frage: Was ist das "wichtigste" Ergebnis dieser Zufallsvariablen?

Um "Wichtigkeit" zu verdeutlichen, welches Ergebnis hat die meisten anderen Ergebnisse als logische Konsequenz? Welches der Ergebnisse wird in der Praxis am häufigsten verwendet?

scheint es unter (theoretischen) Statistikern folkloristisches Wissen zu sein, dass die zumindest asymptotisch "im Grunde die gleichen wie" sind. (Siehe diese verwandte Frage .)Zn2logn

Es gibt jedoch viele verwandte Ergebnisse dieses Typs, und es scheint der Fall zu sein, dass die meisten nicht gleichwertig sind oder sich gegenseitig implizieren. Zum Beispiel ,

(1)Zn2logna.s.1,

was nicht zuletzt auch die entsprechenden Ergebnisse in Wahrscheinlichkeit und Verteilung impliziert.

Es impliziert jedoch nicht einmal scheinbar auch verwandte Ergebnisse (siehe diese andere Frage ), wie z

(2)limnEZn2logn=1,

(Dies ist Übung 2.17 auf S. 49 von ) oder ein anderes Folkloreergebnis :

(3)EZn=2logn+Θ(1).

Nicht asymptotisch ist auch bekannt, dass für jedes (siehe hier für einen Beweis),n

(4)clognEZn2logn

für einige kleine . Ähnliche Ergebnisse können auch für, da stark nach rechts ist.c|Zn|Zn

Der Beweis dieses letzten Ergebnisses ist viel einfacher als die Beweise der anderen Ergebnisse. Meine Hoffnung war gewesen, dass das erste asymptotische Ergebnis alle anderen asymptotischen Ergebnisse impliziert hätte, so dass ich mich sicher fühlen konnte, meine ganze Zeit und Energie darauf zu konzentrieren, dieses Ergebnis zu verstehen. Aber auch das scheint nicht zu stimmen , und jetzt ist mir unklar, worauf ich mich konzentrieren sollte.

Siehe S. 265-267 der zweiten Ausgabe von Galambos, The Asymptotic Theory of Extreme Order Statistics , gedruckt 1987. Es wird wahrscheinlich auch irgendwo in der ersten Ausgabe angegeben.

Boucheron, Lugosi, Massart, Konzentrationsungleichheiten: Eine nichtasymptotische Theorie der Unabhängigkeit . Nebenbei: Dieses Buch zitiert tatsächlich Galambos für das fragliche Ergebnis, aber ich kann es nirgendwo in Galambos finden - nur das erste Ergebnis, das ich erwähnt habe.


1
Wissen Sie, dass bei Verwendung von \ dots in MathJax das Ergebnis manchmal so aussieht, als hätten Sie \ ldots verwendet, und manchmal so, als hätten Sie \ cdots verwendet, je nach Kontext? In dieser Frage habe ich \ dots durch \ ldots ersetzt.
X_1, \dots, X_n, \dots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)
Michael Hardy

@ MichaelHardy Oh, ich dachte, es war immer zentriert. Danke für die Fehlerbehebung!
Chill2Macht

Antworten:


4

In jeder probabilistischen Anwendung ist das grundlegendste Objekt die Verteilung, wobei die Momente und begrenzenden Eigenschaften daraus ableitbar sind. Daher ist das "wichtigste" Ergebnis in dem von Ihnen beschriebenen Sinne die vollständige Verteilungsfunktion (äquivalent die entsprechende Dichtefunktion). In der Praxis ist dieses Verteilungsergebnis möglicherweise weniger aufschlussreich als einige der grundlegenderen asymptotischen Eigenschaften, die Sie bereits aufgelistet haben. Obwohl dies logischerweise diese asymptotischen Ergebnisse impliziert, sind diese Ergebnisse meiner Ansicht nach wahrscheinlich aufschlussreicher, wenn es darum geht, die sich ändernde Natur des Extremwerts zu verstehen, wenn wir ändern .FZn(z)=Φn(z)n

Aus Ihrer Frage geht hervor, dass Sie die Extremwerteigenschaften bei maximal IID-Standard-Zufallsvariablen gut verstehen. Diese Eigenschaften sind alle logisch von der Verteilungsfunktion für ableitbar , so dass dies das grundlegendste Objekt ist, das in diesem Problem am Werk ist. Wie in vielen Fällen ist das grundlegendste Objekt nicht unbedingt das aufschlussreichste, und Sie werden wahrscheinlich feststellen, dass Sie damit auskommen müssen, alle Ergebnisse zu kennen und zu wissen, dass sie verschiedene Aspekte des Problems beleuchten.Zn


Danke für diese Antwort - ich weiß es zu schätzen. Kennen Sie eine Referenz, wie Sie all diese Eigenschaften aus der Verteilungsfunktion für ? Ich hatte extreme Schwierigkeiten, etwas zu finden, das dies erklärt, weil alles entweder "Folklore" oder "Händchenhalten" ist. Zn
Chill2Macht

Für die Aufzeichnung habe ich die Links gelesen und sie helfen nicht. Deshalb habe ich die Frage gestellt.
Chill2Macht

1
Ich habe keine spezifische Referenz zu empfehlen, aber ich würde denken, dass diese Ergebnisse in Büchern über Extremwerttheorie abgeleitet werden. Ich würde vorschlagen, dass Sie zunächst nach Texten für Hochschulabsolventen zu diesem Thema suchen und prüfen, ob Sie dort die Ableitungen finden können.
Ben - Reinstate Monica

1

WIP: In Arbeit

Nach p. 370 von Cramers mathematischen Methoden der Statistik von 1946 definierenHier ist die kumulative Verteilungsfunktion der Standardnormalverteilung . Infolge seiner Definition ist uns fast sicher, dass .

Ξn=n(1Φ(Zn)).
ΦN(0,1)0Ξnn

Betrachten Sie eine gegebene Realisierung unseres Probenraums. In diesem Sinne ist sowohl eine Funktion von und als auch eine Funktion von und . Für ein festes können wir als deterministische Funktion von und als deterministische Funktion von und , wodurch das Problem vereinfacht wird. Wir wollen Ergebnisse zeigen, die mit ziemlicher Sicherheit für alleωΩZnnωΞnZn,nωωZnnΞnZnnωΩDies ermöglicht es uns, unsere Ergebnisse von einer nicht deterministischen Analyse auf die nicht deterministische Umgebung zu übertragen.

Nach p. 374 von Cramers mathematischen Methoden der Statistik von 1946 gehen für den Moment davon aus (ich möchte später zurückkommen und einen Beweis liefern), dass wir zeigen können, dass (für jedes gegebene ) die folgende asymptotische Expansion gilt (unter Verwendung von Teilintegration und Definition von ):ωΩΦ

(~)2πnΞn=1ZneZn22(1+O(1Zn2))  as  Zn.

Es ist klar, dass für jedes , und ist mit ziemlicher Sicherheit eine zunehmende Funktion von als , daher behaupten wir im Folgenden für (fast sicher alle) feste :Zn+1ZnnZnnnω

Znn.

Daraus folgt, dass wir haben (wobei Bezeichnet asymptotische Äquivalenz ):

2πnΞn1Zne1Zn2  as  Znn.

Wie wir im Folgenden vorgehen, entspricht im Wesentlichen der Methode des dominanten Gleichgewichts , und unsere Manipulationen werden formal durch das folgende Lemma gerechtfertigt:

Lemma: Es sei angenommen , daß als , und (also ). Dann müssen wir bei jeder Funktion die durch Zusammensetzungen, Additionen und Multiplikationen von Logarithmen und Potenzgesetzen gebildet wird (im Wesentlichen jede " Polylog " -Funktion), auch die als :Mit anderen Worten, solche "Polylog" -Funktionen bewahren die asymptotische Äquivalenz .f(n)g(n)nf(n)g(n)hn h ( f ( n ) ) h ( g ( n ) )n

h(f(n))h(g(n)).

Die Wahrheit dieses Lemmas ist eine Konsequenz von Satz 2.1. wie hier geschrieben . Beachten Sie auch, dass das Folgende meistens eine erweiterte (detailliertere) Version der Antwort auf eine ähnliche Frage ist, die hier zu finden ist .

Wenn wir die Logarithmen beider Seiten nehmen, erhalten wir Folgendes:

(1)log(2πΞn)lognlogZnZn22.

Hier ist Cramer etwas käfig; er sagt nur "vorausgesetzt ist begrenzt", wir können schließen. Aber zu zeigen, dass ziemlicher Sicherheit angemessen begrenzt ist, scheint eigentlich etwas nicht trivial zu sein. Es scheint, dass der Beweis dafür im Wesentlichen Teil dessen ist, was auf den Seiten 265-267 von Galambos besprochen wird, aber ich bin mir nicht sicher, da ich immer noch daran arbeite, den Inhalt dieses Buches zu verstehen.ΞnΞn

Unter der AnnahmelogΞn=o(logn) , dass man zeigen kann, dass , folgt daraus (da der Term dominiert ), dass:Zn2/2logZn

lognZn22Zn2logn.

Das ist etwas schön, da es bereits das meiste ist, was wir zeigen wollen, obwohl es wieder erwähnenswert ist, dass es im Wesentlichen nur die Dose die Straße hinunter tritt, da wir jetzt eine gewisse fast von . Andererseits hat die gleiche Verteilung für jedes Maximum von iid kontinuierlichen Zufallsvariablen, so dass dies nachvollziehbar sein kann.ΞnΞn

Wie auch immer, wenn as ist, kann man eindeutig auch schließen, dass für jedes Das ist als . Unter Verwendung unseres Lemmas über Polylog-Funktionen, bei denen die asymptotische Äquivalenz oben erhalten bleibt, können wir diesen Ausdruck wieder in , um Folgendes zu erhalten:Zn2lognZn2logn(1+α(n))α(n)o(1)n(1)

log(2πΞn)lognlog(1+α)12log212loglognlogn2αlognα2logn.

log(Ξn2π)log(1+α)+12log2+12loglogn+2αlogn+α2logn.

Hier müssen wir noch weiter gehenlogΞn=o(loglogn)  as  n und davon ausgehen, dass fast sicher ist . Wieder sagt Cramer nur "vorausgesetzt, ist begrenzt". Aber da alles, was man a priori über sagen kann , as ist, scheint es kaum klar zu sein, dass man fast sicher haben sollte, was die Substanz von Cramers Behauptung zu sein scheint.ΞnΞn0XinnΞn=O(1)

Aber wie auch immer, ein unter der Annahme , glaubt , dass, dann folgt daraus , dass die dominierende Begriff, der nicht enthält heißt . Da , folgt, dass und eindeutig , so enthält der dominante Term IS . Daher können wir das neu anordnen und (indem wir alles durch oder teilen ) feststellenα12loglognα=o(1)α2=o(α)log(1+α)=o(α)=o(o(αlogn))α2αlogn12loglogn2αlogn

12loglogn2αlognαloglogn4logn.

Wenn wir dies wieder in das Obige einsetzen, erhalten wir Folgendes:

Zn2lognloglogn22logn,

wieder vorausgesetzt, wir glauben bestimmte Dinge über .Ξn

Wir wiederholen dieselbe Technik erneut. da , folgt auch diesZn2lognloglogn22logn

Zn2lognloglogn22logn(1+β(n))=2logn(1loglogn8logn(1+β(n))),

wenn . Lassen Sie uns ein wenig vereinfachen, bevor wir direkt in (1) zurückkehren. wir bekommen das:β(n)=o(1)

logZnlog(2logn)+log(1loglogn8logn(1+β(n)))log(O(1))=o(logn)log(2logn).

Zn22logn12loglogn(1+β)+(loglogn)28logn(1β)2o((1+β)loglogn)logn12(1+β)loglogn.

Wenn wir dies wieder in (1) einsetzen, stellen wir fest, dass:

log(2πΞn)lognlog(2logn)logn+12(1+β)loglognβlog(4πΞn2)loglogn.

Daraus schließen wir fast sicher

Zn2lognloglogn22logn(1+log(4π)+2log(Ξn)loglogn)=2lognloglogn+log(4π)22lognlog(Ξn)2logn.

Dies entspricht dem Endergebnis auf S.374 von Cramers Mathematical Methods of Statistics von 1946, außer dass hier die genaue Reihenfolge des Fehlerterms nicht angegeben ist. Anscheinend ergibt die Anwendung dieses weiteren Terms die genaue Reihenfolge des Fehlerterms, aber es scheint ohnehin nicht notwendig zu sein, die Ergebnisse über die Maxima der iid-Standardnormalen zu beweisen, an denen wir interessiert sind.


In Anbetracht des oben genannten Ergebnisses, nämlich mit ziemlicher Sicherheit:

()Zn2lognloglogn+log(4π)22lognlog(Ξn)2lognZn=2lognloglogn+log(4π)22lognlog(Ξn)2logn+o(1).

2. Dann folgt aus der Linearität der Erwartung:

EZn=2lognloglogn+log(4π)22lognE[log(Ξn)]2logn+o(1)EZn2logn=1E[logΞn]2logn+o(1).

Deshalb haben wir das gezeigt

limnEZn2logn=1,

solange wir das auch zeigen können

E[logΞn]=o(logn).

Dies ist möglicherweise nicht allzu schwierig , da für jede kontinuierliche Zufallsvariable wieder dieselbe Verteilung hat . Somit haben wir das zweite Ergebnis von oben.Ξn

1. In ähnlicher Weise haben wir auch von oben, dass fast sicher:

Zn2logn=1log(Ξn)2logn+o(1),.

Wenn wir das zeigen können:

(*)log(Ξn)=o(logn) almost surely,

dann haben wir das erste Ergebnis von oben gezeigt. Ergebnis (*) würde auch eindeutig ein Fortiori implizieren, dass , wodurch wir auch das erste Ergebnis von oben erhalten.E[log(Ξn)]=o(logn)

Beachten Sie auch, dass wir im obigen Beweis von ( ) ohnehin davon ausgehen mussten, dass fast sicher (oder zumindest etwas Ähnliches) ist, damit wir dann ( ) zeigen können Wir werden höchstwahrscheinlich auch den Prozess haben, der erforderlich ist, um fast sicher zu zeigen, und wenn wir daher beweisen können wir höchstwahrscheinlich in der Lage sein, sofort alle folgenden Schlussfolgerungen zu ziehen.Ξn=o(logn)Ξn=o(logn)()

3. Wenn wir jedoch dieses Ergebnis haben, dann verstehe ich nicht, wie man auch das , da . Aber zumindest scheint es wahr zu sein, dassEZn=2logn+Θ(1)o(1)Θ(1)

EZn=2logn+O(1).


Dann können wir uns also darauf konzentrieren, die Frage zu beantworten, wie man

Ξn=o(logn) almost surely.

Wir müssen auch die Grunzarbeit machen, einen Beweis für (~) zu liefern, aber nach meinem besten Wissen ist das nur Kalkül und beinhaltet keine Wahrscheinlichkeitstheorie, obwohl ich mich noch nicht hinsetzen und es noch versuchen muss.

Lassen Sie uns zunächst eine Reihe von Trivialitäten durchgehen, um das Problem so umzuformulieren, dass es leichter zu lösen ist (beachten Sie, dass per Definition ):Ξn0

Ξn=o(logn)limnΞnlogn=0ε>0,Ξnlogn>ε only finitely many timesε>0,Ξn>εlogn only finitely many times.

Man hat auch das:

Ξn>εlognn(1F(Zn))>εlogn1F(Zn)>εlognnF(Zn)<1εlognnZninf{y:F(y)1εlognn}.

Definieren Sie entsprechend für alle :n

un(ε)=inf{y:F(y)1εlognn}.

Daher zeigen uns die obigen Schritte, dass:

Ξn=o(logn) a.s.P(Ξn=o(logn))=1P(ε>0,Ξn>εlogn only finitely many times)=1P(ε>0,Znun(ε) only finitely many times)=1P(ε>0,Znun(ε) infinitely often)=0.

Beachten Sie, dass wir schreiben können:

{ε>0,Znun(ε) infinitely often}=ε>0{Znun(ε) infinitely often}.

Die Sequenzen werden mit abnehmendem gleichmäßig größer , sodass wir schließen können, dass die Ereignisse abnehmen (oder zumindest irgendwie monoton), da auf geht . Das Wahrscheinlichkeitsaxiom bezüglich monotoner Ereignissequenzen lässt daher den Schluss zu:un(ε)ε

{Znun(ε) infinitely often}
ε0

P(ε>0,Znun(ε) infinitely often)=P(ε>0{Znun(ε) infinitely often})=P(limε0{Znun(ε) infinitely often})=limε0P(Znun(ε) infinitely often).

Daher genügt es zu zeigen, dass für alle ,ε>0

P(Znun(ε) infinitely often)=0

denn natürlich ist die Grenze jeder konstanten Folge die Konstante.

Hier ist so etwas wie ein Vorschlaghammer-Ergebnis:

Satz 4.3.1., P. 252 von Galambos, The Asymptotic Theory of Extreme Order Statistics , 2. Auflage. Sei iid Variablen mit gemeinsamer nicht entarteter und kontinuierlicher Verteilungsfunktion , und sei eine nicht abnehmende Folge, so dass ebenfalls nicht abnehmend ist. Dann wird für , nach wie X1,X2,F(x)unn(1F(un))un<sup{x:F(x)<1}

P(Znun infinitely often)=0 or 1
j=1+[1F(uj)]exp(j[1F(uj)])<+ or =+.

Der Beweis ist technisch und dauert ungefähr fünf Seiten, aber letztendlich stellt sich heraus, dass er eine Folge einer der Borel-Cantelli-Deckspelzen ist. Ich werde vielleicht versuchen, den Beweis zu verdichten, um nur den für diese Analyse erforderlichen Teil sowie nur die Annahmen zu verwenden, die im Gaußschen Fall gelten, der kürzer sein kann (aber vielleicht nicht), und tippe ihn hier ein. Es wird jedoch nicht empfohlen, den Atem anzuhalten. Man beachte , dass in diesem Fall , so daß die Bedingung vacuous ist, und ist somit eindeutig nicht abnimmt.ω(F)=+n(1F(n))εlogn

Der Punkt ist jedenfalls, dass wir diesen Satz ansprechen, wenn wir das zeigen können:

j=1+[1F(uj(ε))]exp(j[1F(uj(ε))])=j=1+[εlogjj]exp(εlogj)=εj=1+logjj1+ε<+.

Da das logarithmische Wachstum für jeden Exponenten des positiven Potenzgesetzes langsamer ist als jedes Potenzgesetzwachstum (Logarithmen und Exponentiale bleiben monoton), ist und die frühere Ungleichung gelten immer für alle groß genug sind, da und eine Änderung der Variablen) Folgendes haben:loglognαlognlognnαnlognn

j=1+logjj1+εj=1+jε/2j1+ε=j=1+1j1+ε/2<+,

da bekannt ist, dass die p-Reihe für alle konvergiert und natürlich impliziert .p>1ε>01+ε/2>1

So unter Verwendung der obigen Satz haben wir gezeigt , dass für alle , , was zu rekapitulieren bedeuten soll , dass fast sicher.ε>0P(Znun(ε) i.o.)=0Ξn=o(logn)

Wir müssen noch zeigen, dass . Dies folgt nicht aus dem Obigen, da z.logΞn=o(loglogn)

1nlogn=o(logn),logn+loglogno(logn).

Wenn man jedoch bei einer gegebenen Folge zeigen kann, dass für beliebiges , folgt daraus, dass . Idealerweise möchte ich dies für mit dem obigen Lemma zeigen können (vorausgesetzt, es ist sogar wahr), kann es aber (noch) nicht.xnxn=o((logn)δ)δ>0log(xn)=o(loglogn)Ξn

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.