Was ist das stärkste Ergebnis über das Maximum der iid Gaußschen? Am häufigsten in der Praxis eingesetzt?

Berücksichtigen Sie bei $X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1)$ iid die Zufallsvariablen

Z_{n} := max_{1 \leq i \leq n} X_{i} .

$Z_n := \max_{1 \le i \le n} X_i\,.$

Frage: Was ist das "wichtigste" Ergebnis dieser Zufallsvariablen?

Um "Wichtigkeit" zu verdeutlichen, welches Ergebnis hat die meisten anderen Ergebnisse als logische Konsequenz? Welches der Ergebnisse wird in der Praxis am häufigsten verwendet?

scheint es unter (theoretischen) Statistikern folkloristisches Wissen zu sein, dass die zumindest asymptotisch "im Grunde die gleichen wie" sind. (Siehe diese verwandte Frage .) $Z_n$ $\sqrt{2 \log n}$

Es gibt jedoch viele verwandte Ergebnisse dieses Typs, und es scheint der Fall zu sein, dass die meisten nicht gleichwertig sind oder sich gegenseitig implizieren. Zum Beispiel , $^*$

\begin{matrix} (1) & \frac{Z_{n}}{\sqrt{2 \log n}} \overset{a . s .}{\to} 1, \end{matrix}

$\frac{Z_n}{\sqrt{2 \log n}} \overset{a.s.}{\to} 1 \,, \tag{1}$

was nicht zuletzt auch die entsprechenden Ergebnisse in Wahrscheinlichkeit und Verteilung impliziert.

Es impliziert jedoch nicht einmal scheinbar auch verwandte Ergebnisse (siehe diese andere Frage ), wie z

\begin{matrix} (2) & lim_{n \to \infty} \frac{E Z_{n}}{\sqrt{2 \log n}} = 1, \end{matrix}

$\lim_{n \to \infty} \frac{\mathbb{E}Z_n}{\sqrt{2 \log n}} =1 \,, \tag{2}$

(Dies ist Übung 2.17 auf S. 49 von ) oder ein anderes Folkloreergebnis : $\dagger$

\begin{matrix} (3) & E Z_{n} = \sqrt{2 \log n} + Θ (1) . \end{matrix}

$\mathbb{E}Z_n = \sqrt{2 \log n} + \Theta(1) \,. \tag{3}$

Nicht asymptotisch ist auch bekannt, dass für jedes (siehe hier für einen Beweis), $n$

\begin{matrix} (4) & \sqrt{c \log n} \leq E Z_{n} \leq \sqrt{2 \log n} \end{matrix}

$\sqrt{c \log n} \le \mathbb{E}Z_n \le \sqrt{2 \log n} \tag{4}$

für einige kleine . Ähnliche Ergebnisse können auch für, da stark nach rechts ist. $c$ $|Z_n|$ $Z_n$

Der Beweis dieses letzten Ergebnisses ist viel einfacher als die Beweise der anderen Ergebnisse. Meine Hoffnung war gewesen, dass das erste asymptotische Ergebnis alle anderen asymptotischen Ergebnisse impliziert hätte, so dass ich mich sicher fühlen konnte, meine ganze Zeit und Energie darauf zu konzentrieren, dieses Ergebnis zu verstehen. Aber auch das scheint nicht zu stimmen , und jetzt ist mir unklar, worauf ich mich konzentrieren sollte.

$^*$ Siehe S. 265-267 der zweiten Ausgabe von Galambos, The Asymptotic Theory of Extreme Order Statistics , gedruckt 1987. Es wird wahrscheinlich auch irgendwo in der ersten Ausgabe angegeben.

$\dagger$ Boucheron, Lugosi, Massart, Konzentrationsungleichheiten: Eine nichtasymptotische Theorie der Unabhängigkeit . Nebenbei: Dieses Buch zitiert tatsächlich Galambos für das fragliche Ergebnis, aber ich kann es nirgendwo in Galambos finden - nur das erste Ergebnis, das ich erwähnt habe.

— Chill2Macht
quelle

Wissen Sie, dass bei Verwendung von \ dots in MathJax das Ergebnis manchmal so aussieht, als hätten Sie \ ldots verwendet, und manchmal so, als hätten Sie \ cdots verwendet, je nach Kontext? In dieser Frage habe ich \ dots durch \ ldots ersetzt.

\begin{aligned} X_1, \dots, X_n, \dots \sim \mathscr{N}(0,1) & X_{1}, \dots, X_{n}, \dots \sim N (0, 1) \\ X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1) & X_{1}, \dots, X_{n}, \dots \sim N (0, 1) \end{aligned}

$\begin{align} & \text{X_1, \dots, X_n, \dots \sim \mathscr{N}(0,1)} & & X_1, \dots, X_n, \dots \sim \mathscr{N}(0,1) \\ \\ & \text{X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1)} & & X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1) \end{align}$

— Michael Hardy

@ MichaelHardy Oh, ich dachte, es war immer zentriert. Danke für die Fehlerbehebung!

— Chill2Macht

In jeder probabilistischen Anwendung ist das grundlegendste Objekt die Verteilung, wobei die Momente und begrenzenden Eigenschaften daraus ableitbar sind. Daher ist das "wichtigste" Ergebnis in dem von Ihnen beschriebenen Sinne die vollständige Verteilungsfunktion (äquivalent die entsprechende Dichtefunktion). In der Praxis ist dieses Verteilungsergebnis möglicherweise weniger aufschlussreich als einige der grundlegenderen asymptotischen Eigenschaften, die Sie bereits aufgelistet haben. Obwohl dies logischerweise diese asymptotischen Ergebnisse impliziert, sind diese Ergebnisse meiner Ansicht nach wahrscheinlich aufschlussreicher, wenn es darum geht, die sich ändernde Natur des Extremwerts zu verstehen, wenn wir ändern . $F_{Z_n}(z) = \Phi^n(z)$ $n$

Aus Ihrer Frage geht hervor, dass Sie die Extremwerteigenschaften bei maximal IID-Standard-Zufallsvariablen gut verstehen. Diese Eigenschaften sind alle logisch von der Verteilungsfunktion für ableitbar , so dass dies das grundlegendste Objekt ist, das in diesem Problem am Werk ist. Wie in vielen Fällen ist das grundlegendste Objekt nicht unbedingt das aufschlussreichste, und Sie werden wahrscheinlich feststellen, dass Sie damit auskommen müssen, alle Ergebnisse zu kennen und zu wissen, dass sie verschiedene Aspekte des Problems beleuchten. $Z_n$

— Ben - Monica wieder einsetzen
quelle

Danke für diese Antwort - ich weiß es zu schätzen. Kennen Sie eine Referenz, wie Sie all diese Eigenschaften aus der Verteilungsfunktion für ? Ich hatte extreme Schwierigkeiten, etwas zu finden, das dies erklärt, weil alles entweder "Folklore" oder "Händchenhalten" ist.

Z_{n}

$Z_n$

— Chill2Macht

Für die Aufzeichnung habe ich die Links gelesen und sie helfen nicht. Deshalb habe ich die Frage gestellt.

— Chill2Macht

Ich habe keine spezifische Referenz zu empfehlen, aber ich würde denken, dass diese Ergebnisse in Büchern über Extremwerttheorie abgeleitet werden. Ich würde vorschlagen, dass Sie zunächst nach Texten für Hochschulabsolventen zu diesem Thema suchen und prüfen, ob Sie dort die Ableitungen finden können.

— Ben - Reinstate Monica

WIP: In Arbeit

Nach p. 370 von Cramers mathematischen Methoden der Statistik von 1946 definierenHier ist die kumulative Verteilungsfunktion der Standardnormalverteilung . Infolge seiner Definition ist uns fast sicher, dass .

Ξ_{n} = n (1 - Φ (Z_{n})) .

$\Xi_n = n(1 - \Phi(Z_n)) \,.$

Φ

$\Phi$

N (0, 1)

$\mathscr{N}(0,1)$

0 \leq Ξ_{n} \leq n

$0\le \Xi_n \le n$

Betrachten Sie eine gegebene Realisierung unseres Probenraums. In diesem Sinne ist sowohl eine Funktion von und als auch eine Funktion von und . Für ein festes können wir als deterministische Funktion von und als deterministische Funktion von und , wodurch das Problem vereinfacht wird. Wir wollen Ergebnisse zeigen, die mit ziemlicher Sicherheit für alle $\omega \in \Omega$ $Z_n$ $n$ $\omega$ $\Xi_n$ $Z_n, n$ $\omega$ $\omega$ $Z_n$ $n$ $\Xi_n$ $Z_n$ $n$ $\omega \in \Omega$ Dies ermöglicht es uns, unsere Ergebnisse von einer nicht deterministischen Analyse auf die nicht deterministische Umgebung zu übertragen.

Nach p. 374 von Cramers mathematischen Methoden der Statistik von 1946 gehen für den Moment davon aus (ich möchte später zurückkommen und einen Beweis liefern), dass wir zeigen können, dass (für jedes gegebene ) die folgende asymptotische Expansion gilt (unter Verwendung von Teilintegration und Definition von ): $\omega \in \Omega$ $\Phi$

\begin{matrix} (~) & \frac{\sqrt{2 π}}{n} Ξ_{n} = \frac{1}{Z_{n}} e^{- \frac{Z_{n}^{2}}{2}} (1 + O (\frac{1}{Z_{n}^{2}})) a s Z_{n} \to \infty . \end{matrix}

$\frac{\sqrt{2\pi}}{n}\Xi_n = \frac{1}{Z_n}e^{-\frac{Z_n^2}{2}}\left( 1 + O \left( \frac{1}{Z_n^2} \right) \right) \quad ~~ as ~~ Z_n \to \infty \,. \tag{~}$

Es ist klar, dass für jedes , und ist mit ziemlicher Sicherheit eine zunehmende Funktion von als , daher behaupten wir im Folgenden für (fast sicher alle) feste : $Z_{n+1} \ge Z_n$ $n$ $Z_n$ $n$ $n\to \infty$ $\omega$

Z_{n} \to \infty ⟺ n \to \infty .

$Z_n \to \infty \quad \iff \quad n \to \infty \,.$

Daraus folgt, dass wir haben (wobei Bezeichnet asymptotische Äquivalenz ): $\sim$

\frac{\sqrt{2 π}}{n} Ξ_{n} \sim \frac{1}{Z_{n}} e^{- \frac{1}{Z_{n}^{2}}} a s Z_{n} \to \infty n \to \infty .

$\frac{\sqrt{2\pi}}{n} \Xi_n \sim \frac{1}{Z_n} e^{-\frac{1}{Z_n^2}} \quad ~~ as ~~ Z_n \to \infty \quad n \to \infty \,.$

Wie wir im Folgenden vorgehen, entspricht im Wesentlichen der Methode des dominanten Gleichgewichts , und unsere Manipulationen werden formal durch das folgende Lemma gerechtfertigt:

Lemma: Es sei angenommen , daß als , und (also ). Dann müssen wir bei jeder Funktion die durch Zusammensetzungen, Additionen und Multiplikationen von Logarithmen und Potenzgesetzen gebildet wird (im Wesentlichen jede " Polylog " -Funktion), auch die als :Mit anderen Worten, solche "Polylog" -Funktionen bewahren die asymptotische Äquivalenz . $f(n) \sim g(n)$ $n \to \infty$ $f(n) \to \infty$ $g(n) \to \infty$ $h$ $n \to \infty$
$h (f (n)) \sim h (g (n)) .$ $h(f(n)) \sim h(g(n)) \,.$

Die Wahrheit dieses Lemmas ist eine Konsequenz von Satz 2.1. wie hier geschrieben . Beachten Sie auch, dass das Folgende meistens eine erweiterte (detailliertere) Version der Antwort auf eine ähnliche Frage ist, die hier zu finden ist .

Wenn wir die Logarithmen beider Seiten nehmen, erhalten wir Folgendes:

\begin{matrix} (1) & \log (\sqrt{2 π} Ξ_{n}) - \log n \sim - \log Z_{n} - \frac{Z_{n}^{2}}{2} . \end{matrix}

$\log ( \sqrt{2\pi} \Xi_n ) - \log n \sim -\log Z_n - \frac{Z_n^2}{2} \,. \tag{1}$

Hier ist Cramer etwas käfig; er sagt nur "vorausgesetzt ist begrenzt", wir können schließen. Aber zu zeigen, dass ziemlicher Sicherheit angemessen begrenzt ist, scheint eigentlich etwas nicht trivial zu sein. Es scheint, dass der Beweis dafür im Wesentlichen Teil dessen ist, was auf den Seiten 265-267 von Galambos besprochen wird, aber ich bin mir nicht sicher, da ich immer noch daran arbeite, den Inhalt dieses Buches zu verstehen. $\Xi_n$ $\Xi_n$

Unter der Annahme $\log \Xi_n = o(\log n)$ , dass man zeigen kann, dass , folgt daraus (da der Term dominiert ), dass: $-Z_n^2/2$ $-\log Z_n$

- \log n \sim - \frac{Z_{n}^{2}}{2} ⟹ Z_{n} \sim \sqrt{2 \log n} .

$- \log n \sim - \frac{Z_n^2}{2} \quad \implies \quad Z_n \sim \sqrt{2 \log n} \,.$

Das ist etwas schön, da es bereits das meiste ist, was wir zeigen wollen, obwohl es wieder erwähnenswert ist, dass es im Wesentlichen nur die Dose die Straße hinunter tritt, da wir jetzt eine gewisse fast von . Andererseits hat die gleiche Verteilung für jedes Maximum von iid kontinuierlichen Zufallsvariablen, so dass dies nachvollziehbar sein kann. $\Xi_n$ $\Xi_n$

Wie auch immer, wenn as ist, kann man eindeutig auch schließen, dass für jedes Das ist als . Unter Verwendung unseres Lemmas über Polylog-Funktionen, bei denen die asymptotische Äquivalenz oben erhalten bleibt, können wir diesen Ausdruck wieder in , um Folgendes zu erhalten: $Z_n \sim \sqrt{2 \log n}$ $Z_n \sim \sqrt{2 \log n}(1 + \alpha(n))$ $\alpha(n)$ $o(1)$ $n \to \infty$ $(1)$

\log (\sqrt{2 π} Ξ_{n}) - \log n \sim - \log (1 + α) - \frac{1}{2} \log 2 - \frac{1}{2} \log \log n - \log n - 2 α \log n - α^{2} \log n .

$\log(\sqrt{2 \pi} \Xi _n)- \log n \sim -\log (1 + \alpha) - \frac{1}{2}\log 2 - \frac{1}{2}\log \log n - \log n - 2 \alpha \log n - \alpha^2 \log n \,.$

⟹ - \log (Ξ_{n} \sqrt{2 π}) \sim \log (1 + α) + \frac{1}{2} \log 2 + \frac{1}{2} \log \log n + 2 α \log n + α^{2} \log n .

$\implies -\log(\Xi_n \sqrt{2 \pi}) \sim \log(1 + \alpha) + \frac{1}{2} \log 2 + \frac{1}{2} \log \log n + 2\alpha \log n + \alpha^2 \log n \,.$

Hier müssen wir noch weiter gehen $\log \Xi_n = o( \log \log n) ~~ as ~~ n \to \infty$ und davon ausgehen, dass fast sicher ist . Wieder sagt Cramer nur "vorausgesetzt, ist begrenzt". Aber da alles, was man a priori über sagen kann , as ist, scheint es kaum klar zu sein, dass man fast sicher haben sollte, was die Substanz von Cramers Behauptung zu sein scheint. $\Xi_n$ $\Xi_n$ $0 \le Xi_n \le n$ $\Xi_n = O(1)$

Aber wie auch immer, ein unter der Annahme , glaubt , dass, dann folgt daraus , dass die dominierende Begriff, der nicht enthält heißt . Da , folgt, dass und eindeutig , so enthält der dominante Term IS . Daher können wir das neu anordnen und (indem wir alles durch oder teilen ) feststellen $\alpha$ $\frac{1}{2} \log \log n$ $\alpha = o(1)$ $\alpha^2 = o(\alpha)$ $\log ( 1 + \alpha) = o (\alpha) = o(o(\alpha \log n))$ $\alpha$ $2 \alpha \log n$ $\frac{1}{2}\log\log n$ $2 \alpha \log n$

- \frac{1}{2} \log \log n \sim 2 α \log n ⟹ α \sim - \frac{\log \log n}{4 \log n} .

$- \frac{1}{2} \log \log n \sim 2 \alpha \log n \quad \implies \quad \alpha \sim - \frac{\log \log n}{4 \log n} \,.$

Wenn wir dies wieder in das Obige einsetzen, erhalten wir Folgendes:

Z_{n} \sim \sqrt{2 \log n} - \frac{\log \log n}{2 \sqrt{2 \log n}},

$Z_n \sim \sqrt{2 \log n}- \frac{\log\log n}{2 \sqrt{2 \log n}} \,,$

wieder vorausgesetzt, wir glauben bestimmte Dinge über . $\Xi_n$

Wir wiederholen dieselbe Technik erneut. da , folgt auch dies $Z_n \sim \sqrt{2 \log n} - \frac{\log \log n}{2 \sqrt{2 \log n}}$

Z_{n} \sim \sqrt{2 \log n} - \frac{\log \log n}{2 \sqrt{2 \log n}} (1 + β (n)) = \sqrt{2 \log n} (1 - \frac{\log \log n}{8 \log n} (1 + β (n))),

$Z_n \sim \sqrt{2 \log n} - \frac{\log \log n}{2 \sqrt{2 \log n}} (1 + \beta(n)) = \sqrt{2 \log n} \left( 1 - \frac{\log \log n}{8 \log n}(1 + \beta(n)) \right) \,,$

wenn . Lassen Sie uns ein wenig vereinfachen, bevor wir direkt in (1) zurückkehren. wir bekommen das: $\beta(n)=o(1)$

\log Z_{n} \sim \log (\sqrt{2 \log n}) + \underset{\log (O (1)) = o (\log n)}{\underset{⏟}{\log (1 - \frac{\log \log n}{8 \log n} (1 + β (n)))}} \sim \log (\sqrt{2 \log n}) .

$\log Z_n \sim \log(\sqrt{2 \log n}) + \underbrace{\log \left(1 - \frac{\log \log n}{8 \log n}(1 + \beta(n)) \right) }_{\log(O(1)) = o(\log n)} \sim \log (\sqrt{2 \log n}) \,.$

\frac{Z_{n}^{2}}{2} \sim \log n - \frac{1}{2} \log \log n (1 + β) + \underset{o ((1 + β) \log \log n)}{\underset{⏟}{\frac{(\log \log n)^{2}}{8 \log n} (1 β)^{2}}} \sim \log n - \frac{1}{2} (1 + β) \log \log n .

$\frac{Z_n^2}{2} \sim \log n - \frac{1}{2} \log \log n (1 + \beta) + \underbrace{\frac{(\log \log n)^2}{8 \log n} ( 1 \beta)^2}_{o((1+ \beta) \log \log n)} \sim \log n - \frac{1}{2} (1 + \beta) \log \log n \,.$

Wenn wir dies wieder in (1) einsetzen, stellen wir fest, dass:

\log (\sqrt{2 π} Ξ_{n}) - \log n \sim - \log (\sqrt{2 \log n}) - \log n + \frac{1}{2} (1 + β) \log \log n ⟹ β \sim \frac{\log (4 π Ξ_{n}^{2})}{\log \log n} .

$\log ( \sqrt{2 \pi} \Xi_n) - \log n \sim - \log(\sqrt{2 \log n}) - \log n + \frac{1}{2}(1 + \beta) \log \log n \quad \implies \quad \beta \sim \frac{\log (4 \pi \Xi_n^2)}{\log \log n} \,.$

Daraus schließen wir fast sicher

Z_{n} \sim \sqrt{2 \log n} - \frac{\log \log n}{2 \sqrt{2 \log n}} (1 + \frac{\log (4 π) + 2 \log (Ξ_{n})}{\log \log n}) = \sqrt{2 \log n} - \frac{\log \log n + \log (4 π)}{2 \sqrt{2 \log n}} - \frac{\log (Ξ_{n})}{\sqrt{2 \log n}} .

$Z_n \sim \sqrt{2 \log n} - \frac{\log \log n}{2 \sqrt{2 \log n}} \left(1 + \frac{\log(4 \pi) + 2 \log( \Xi_n)}{\log \log n} \right)\\ = \sqrt{2 \log n} - \frac{\log \log n + \log (4 \pi)}{ 2 \sqrt{2 \log n} } - \frac{\log (\Xi_n)}{\sqrt{2 \log n}} \,.$

Dies entspricht dem Endergebnis auf S.374 von Cramers Mathematical Methods of Statistics von 1946, außer dass hier die genaue Reihenfolge des Fehlerterms nicht angegeben ist. Anscheinend ergibt die Anwendung dieses weiteren Terms die genaue Reihenfolge des Fehlerterms, aber es scheint ohnehin nicht notwendig zu sein, die Ergebnisse über die Maxima der iid-Standardnormalen zu beweisen, an denen wir interessiert sind.

In Anbetracht des oben genannten Ergebnisses, nämlich mit ziemlicher Sicherheit:

\begin{matrix} (†) & Z_{n} \sim \sqrt{2 \log n} - \frac{\log \log n + \log (4 π)}{2 \sqrt{2 \log n}} - \frac{\log (Ξ_{n})}{\sqrt{2 \log n}} ⟹ Z_{n} = \sqrt{2 \log n} - \frac{\log \log n + \log (4 π)}{2 \sqrt{2 \log n}} - \frac{\log (Ξ_{n})}{\sqrt{2 \log n}} + o (1) . \end{matrix}

$Z_n \sim \sqrt{2 \log n} - \frac{\log \log n + \log (4 \pi)}{2 \sqrt{2 \log n}} - \frac{\log (\Xi_n)}{\sqrt{2 \log n}} \quad \implies \\ Z_n = \sqrt{2 \log n} - \frac{\log \log n + \log (4 \pi)}{2 \sqrt{2 \log n}} - \frac{\log (\Xi_n)}{\sqrt{2 \log n}} + o(1)\,. \tag{$\dagger$}$

2. Dann folgt aus der Linearität der Erwartung:

E Z_{n} = \sqrt{2 \log n} - \frac{\log \log n + \log (4 π)}{2 \sqrt{2 \log n}} - \frac{E [\log (Ξ_{n})]}{\sqrt{2 \log n}} + o (1) ⟹ \frac{E Z_{n}}{\sqrt{2 \log n}} = 1 - \frac{E [\log Ξ_{n}]}{2 \log n} + o (1) .

$\mathbb{E}Z_n = \sqrt{2 \log n} - \frac{\log \log n + \log (4 \pi)}{2 \sqrt{2 \log n}} - \frac{\mathbb{E}[\log (\Xi_n)]}{\sqrt{2 \log n}} + o(1) \quad \implies \\ \frac{\mathbb{E}Z_n}{\sqrt{2 \log n}} = 1 - \frac{\mathbb{E}[\log \Xi_n]}{2 \log n} + o(1) \,.$

Deshalb haben wir das gezeigt

lim_{n \to \infty} \frac{E Z_{n}}{\sqrt{2 \log n}} = 1,

$\lim_{n \to \infty } \frac{\mathbb{E} Z_n}{\sqrt{2 \log n}} = 1 \,,$

solange wir das auch zeigen können

E [\log Ξ_{n}] = o (\log n) .

$\mathbb{E}[\log \Xi_n] = o(\log n) \,.$

Dies ist möglicherweise nicht allzu schwierig , da für jede kontinuierliche Zufallsvariable wieder dieselbe Verteilung hat . Somit haben wir das zweite Ergebnis von oben. $\Xi_n$

1. In ähnlicher Weise haben wir auch von oben, dass fast sicher:

\frac{Z_{n}}{\sqrt{2 \log n}} = 1 - \frac{\log (Ξ_{n})}{2 \log n} + o (1), .

$\frac{Z_n}{\sqrt{2 \log n}} = 1 - \frac{\log(\Xi_n)}{2 \log n} +o(1),.$

Wenn wir das zeigen können:

\begin{matrix} (*) & \log (Ξ_{n}) = o (\log n) almost surely, \end{matrix}

$\log(\Xi_n) = o(\log n) \text{ almost surely}, \tag{*}$

dann haben wir das erste Ergebnis von oben gezeigt. Ergebnis (*) würde auch eindeutig ein Fortiori implizieren, dass , wodurch wir auch das erste Ergebnis von oben erhalten. $\mathbb{E}[\log (\Xi_n)] = o(\log n)$

Beachten Sie auch, dass wir im obigen Beweis von ( ) ohnehin davon ausgehen mussten, dass fast sicher (oder zumindest etwas Ähnliches) ist, damit wir dann ( ) zeigen können Wir werden höchstwahrscheinlich auch den Prozess haben, der erforderlich ist, um fast sicher zu zeigen, und wenn wir daher beweisen können wir höchstwahrscheinlich in der Lage sein, sofort alle folgenden Schlussfolgerungen zu ziehen. $\dagger$ $\Xi_n = o(\log n)$ $\dagger$ $\Xi_n = o(\log n)$ $(\dagger)$

3. Wenn wir jedoch dieses Ergebnis haben, dann verstehe ich nicht, wie man auch das , da . Aber zumindest scheint es wahr zu sein, dass $\mathbb{E}Z_n = \sqrt{2 \log n} + \Theta(1)$ $o(1) \not= \Theta(1)$

E Z_{n} = \sqrt{2 \log n} + O (1) .

$\mathbb{E}Z_n = \sqrt{2 \log n} + O(1) \,.$

Dann können wir uns also darauf konzentrieren, die Frage zu beantworten, wie man

Ξ_{n} = o (\log n) almost surely.

$\Xi_n = o(\log n) \text{ almost surely.}$

Wir müssen auch die Grunzarbeit machen, einen Beweis für (~) zu liefern, aber nach meinem besten Wissen ist das nur Kalkül und beinhaltet keine Wahrscheinlichkeitstheorie, obwohl ich mich noch nicht hinsetzen und es noch versuchen muss.

Lassen Sie uns zunächst eine Reihe von Trivialitäten durchgehen, um das Problem so umzuformulieren, dass es leichter zu lösen ist (beachten Sie, dass per Definition ): $\Xi_n \ge 0$

Ξ_{n} = o (\log n) ⟺ lim_{n \to \infty} \frac{Ξ_{n}}{\log n} = 0 ⟺ \forall ε > 0, \frac{Ξ_{n}}{\log n} > ε only finitely many times ⟺ \forall ε > 0, Ξ_{n} > ε \log n only finitely many times .

$\Xi_n = o(\log n) \quad \iff \quad \lim_{n \to \infty} \frac{\Xi_n}{\log n} = 0 \quad \iff \quad \\ \forall \varepsilon > 0, \frac{\Xi_n}{\log n} > \varepsilon \text{ only finitely many times} \quad \iff \\ \forall \varepsilon >0, \quad \Xi_n > \varepsilon \log n \text{ only finitely many times} \,.$

Man hat auch das:

Ξ_{n} > ε \log n ⟺ n (1 - F (Z_{n})) > ε \log n ⟺ 1 - F (Z_{n}) > \frac{ε \log n}{n} ⟺ F (Z_{n}) < 1 - \frac{ε \log n}{n} ⟺ Z_{n} \leq inf {y : F (y) \geq 1 - \frac{ε \log n}{n}} .

$\Xi_n > \varepsilon \log n \quad \iff \quad n(1 - F(Z_n)) > \varepsilon \log n \quad \iff \quad 1 - F(Z_n) > \frac{\varepsilon \log n}{n} \\ \iff \quad F(Z_n) < 1 - \frac{\varepsilon \log n}{n} \quad \iff \quad Z_n \le \inf \left\{ y: F(y) \ge 1 - \frac{\varepsilon \log n}{n} \right\} \,.$

Definieren Sie entsprechend für alle : $n$

u_{n}^{(ε)} = inf {y : F (y) \geq 1 - \frac{ε \log n}{n}} .

$u_n^{(\varepsilon)} = \inf \left\{ y: F(y) \ge 1 - \frac{\varepsilon \log n}{n} \right\} \,.$

Daher zeigen uns die obigen Schritte, dass:

Ξ_{n} = o (\log n) a.s. ⟺ P (Ξ_{n} = o (\log n)) = 1 ⟺ P (\forall ε > 0, Ξ_{n} > ε \log n only finitely many times) = 1 ⟺ P (\forall ε > 0, Z_{n} \leq u_{n}^{(ε)} only finitely many times) = 1 ⟺ P (\forall ε > 0, Z_{n} \leq u_{n}^{(ε)} infinitely often) = 0 .

$\Xi_n = o(\log n) \text{ a.s.} \quad \iff \quad \mathbb{P}(\Xi_n = o(\log n)) = 1 \quad \iff \quad \\ \mathbb{P}(\forall \varepsilon > 0 , \Xi_n > \varepsilon \log n \text{ only finitely many times}) = 1 \\ \iff \mathbb{P}(\forall \varepsilon > 0, Z_n \le u_n^{(\varepsilon)} \text{ only finitely many times}) = 1 \\ \iff \mathbb{P}(\forall \varepsilon >0, Z_n \le u_n^{(\varepsilon)} \text{ infinitely often}) =0 \,.$

Beachten Sie, dass wir schreiben können:

{\forall ε > 0, Z_{n} \leq u_{n}^{(ε)} infinitely often} = ⋂_{ε > 0} {Z_{n} \leq u_{n}^{(ε)} infinitely often} .

$\{ \forall \varepsilon >0, Z_n \le u_n^{(\varepsilon)} \text{ infinitely often} \} = \bigcap_{\varepsilon > 0} \{ Z_n \le u_n^{(\varepsilon)} \text{ infinitely often} \} \,.$

Die Sequenzen werden mit abnehmendem gleichmäßig größer , sodass wir schließen können, dass die Ereignisse abnehmen (oder zumindest irgendwie monoton), da auf geht . Das Wahrscheinlichkeitsaxiom bezüglich monotoner Ereignissequenzen lässt daher den Schluss zu: $u_n^{(\varepsilon)}$ $\varepsilon$

{Z_{n} \leq u_{n}^{(ε)} infinitely often}

$\{ Z_n \le u_n^{(\varepsilon)} \text{ infinitely often} \}$

ε

$\varepsilon$

0

$0$

P (\forall ε > 0, Z_{n} \leq u_{n}^{(ε)} infinitely often) = P (⋂_{ε > 0} {Z_{n} \leq u_{n}^{(ε)} infinitely often}) = P (lim_{ε ↓ 0} {Z_{n} \leq u_{n}^{(ε)} infinitely often}) = lim_{ε ↓ 0} P (Z_{n} \leq u_{n}^{(ε)} infinitely often) .

$\mathbb{P}(\forall \varepsilon >0, Z_n \le u_n^{(\varepsilon)} \text{ infinitely often}) = \\ \mathbb{P} \left( \bigcap_{\varepsilon > 0} \{ Z_n \le u_n^{(\varepsilon)} \text{ infinitely often} \} \right) = \\ \mathbb{P} \left( \lim_{\varepsilon \downarrow 0} \{ Z_n \le u_n^{(\varepsilon)} \text{ infinitely often} \} \right) = \\ \lim_{\varepsilon \downarrow 0} \mathbb{P}(Z_n \le u_n^{(\varepsilon)} \text{ infinitely often}) \,.$

Daher genügt es zu zeigen, dass für alle , $\varepsilon >0$

P (Z_{n} \leq u_{n}^{(ε)} infinitely often) = 0

$\mathbb{P}(Z_n \le u_n^{(\varepsilon)} \text{ infinitely often}) = 0$

denn natürlich ist die Grenze jeder konstanten Folge die Konstante.

Hier ist so etwas wie ein Vorschlaghammer-Ergebnis:

Satz 4.3.1., P. 252 von Galambos, The Asymptotic Theory of Extreme Order Statistics , 2. Auflage. Sei iid Variablen mit gemeinsamer nicht entarteter und kontinuierlicher Verteilungsfunktion , und sei eine nicht abnehmende Folge, so dass ebenfalls nicht abnehmend ist. Dann wird für , nach wie $X_1, X_2, \dots$ $F(x)$ $u_n$ $n(1 - F(u_n))$ $u_n < \sup \{ x: F(x) <1 \}$
$P (Z_{n} \leq u_{n} infinitely often) = 0 or 1$ $\mathbb{P}(Z_n \le u_n \text{ infinitely often}) =0 \text{ or }1$ $\sum_{j = 1}^{+ \infty} [1 - F (u_{j})] \exp (- j [1 - F (u_{j})]) < + \infty or = + \infty .$ $\sum_{j=1}^{+\infty}[1 - F(u_j)]\exp(-j[1-F(u_j)]) < +\infty \text{ or }=+\infty \,.$

Der Beweis ist technisch und dauert ungefähr fünf Seiten, aber letztendlich stellt sich heraus, dass er eine Folge einer der Borel-Cantelli-Deckspelzen ist. Ich werde vielleicht versuchen, den Beweis zu verdichten, um nur den für diese Analyse erforderlichen Teil sowie nur die Annahmen zu verwenden, die im Gaußschen Fall gelten, der kürzer sein kann (aber vielleicht nicht), und tippe ihn hier ein. Es wird jedoch nicht empfohlen, den Atem anzuhalten. Man beachte , dass in diesem Fall , so daß die Bedingung vacuous ist, und ist somit eindeutig nicht abnimmt. $\omega(F)=+\infty$ $n(1-F(n))$ $\varepsilon \log n$

Der Punkt ist jedenfalls, dass wir diesen Satz ansprechen, wenn wir das zeigen können:

\sum_{j = 1}^{+ \infty} [1 - F (u_{j}^{(ε)})] \exp (- j [1 - F (u_{j}^{(ε)})]) = \sum_{j = 1}^{+ \infty} [\frac{ε \log j}{j}] \exp (- ε \log j) = ε \sum_{j = 1}^{+ \infty} \frac{\log j}{j^{1 + ε}} < + \infty .

$\sum_{j=1}^{+\infty}[1 - F(u_j^{(\varepsilon)})]\exp(-j[1-F(u_j^{(\varepsilon)})]) = \sum_{j=1}^{+\infty}\left[ \frac{\varepsilon \log j}{j} \right]\exp(-\varepsilon \log j) = \varepsilon \sum_{j=1}^{+\infty} \frac{ \log j}{j^{1 + \varepsilon}} < + \infty \,.$

Da das logarithmische Wachstum für jeden Exponenten des positiven Potenzgesetzes langsamer ist als jedes Potenzgesetzwachstum (Logarithmen und Exponentiale bleiben monoton), ist und die frühere Ungleichung gelten immer für alle groß genug sind, da und eine Änderung der Variablen) Folgendes haben: $\log \log n \le \alpha \log n \iff \log n \le n^{\alpha}$ $n$ $\log n \le n$

\sum_{j = 1}^{+ \infty} \frac{\log j}{j^{1 + ε}} \leq \sum_{j = 1}^{+ \infty} \frac{j^{ε / 2}}{j^{1 + ε}} = \sum_{j = 1}^{+ \infty} \frac{1}{j^{1 + ε / 2}} < + \infty,

$\sum_{j=1}^{+\infty} \frac{\log j}{j^{1 + \varepsilon}} \le \sum_{j=1}^{+\infty} \frac{j^{\varepsilon/2}}{j^{1 + \varepsilon}} = \sum_{j=1}^{+\infty} \frac{1}{j^{1 + \varepsilon/2}} < +\infty \,,$

da bekannt ist, dass die p-Reihe für alle konvergiert und natürlich impliziert . $p>1$ $\varepsilon >0$ $1 + \varepsilon/2 > 1$

So unter Verwendung der obigen Satz haben wir gezeigt , dass für alle , , was zu rekapitulieren bedeuten soll , dass fast sicher. $\varepsilon >0$ $\mathbb{P}(Z_n \le u_n^{(\varepsilon)} \text{ i.o.}) = 0$ $\Xi_n = o(\log n)$

Wir müssen noch zeigen, dass . Dies folgt nicht aus dem Obigen, da z. $\log \Xi_n = o(\log \log n)$

\frac{1}{n} \log n = o (\log n), - \log n + \log \log n \neq o (\log n) .

$\frac{1}{n} \log n = o(\log n) \,, - \log n + \log \log n \not= o(\log n) \,.$

Wenn man jedoch bei einer gegebenen Folge zeigen kann, dass für beliebiges , folgt daraus, dass . Idealerweise möchte ich dies für mit dem obigen Lemma zeigen können (vorausgesetzt, es ist sogar wahr), kann es aber (noch) nicht. $x_n$ $x_n = o( (\log n)^{\delta})$ $\delta >0$ $\log(x_n) = o(\log \log n)$ $\Xi_n$

— Chill2Macht
quelle