Die Frage stellt zwei Fragen: (1) Wie kann gezeigt werden, dass das Maximum konvergiert, in dem Sinne, dass (in der Verteilung) für geeignet gewählte Folgen konvergiert und auf die Standard-Gumbel-Verteilung und (2) wie man solche Sequenzen findet. ( X ( n ) - b n ) / a n ( a n ) ( b n )X(n)(X(n)−bn)/an(an)(bn)
Das erste ist bekannt und in den Originalarbeiten zum Fisher-Tippett-Gnedenko-Theorem (FTG) dokumentiert. Die zweite scheint schwieriger zu sein; Das ist das Problem, das hier angesprochen wird.
Bitte beachte, um einige Behauptungen zu verdeutlichen, die an anderer Stelle in diesem Thread auftauchen
Die maximale hat nicht konvergieren etwas: es divergiert (wenn auch sehr langsam).
Es scheint unterschiedliche Konventionen bezüglich der Gumbel-Verteilung zu geben. Ich nehme die Konvention an, dass die CDF einer umgekehrten Gumbel-Verteilung in Maßstab und Position gegeben ist durch . Ein geeignet standardisiertes Maximum von iid-Normalvariablen konvergiert zu einer umgekehrten Gumbel-Verteilung.1−exp(−exp(x))
Intuition
Wenn die mit gemeinsamer Verteilungsfunktion iid sind , die Verteilung des maximalen ist , F X ( n )XiFX(n)
Fn(x)=Pr(X(n)≤x)=Pr(X1≤x)Pr(X2≤x)⋯Pr(Xn≤x)=Fn(x).
Wenn die Unterstützung von keine Obergrenze hat, wie bei einer Normalverteilung, bewegt sich die Folge von Funktionen unbegrenzt für immer nach rechts:F nFFn
Es sind Teilgraphen von für gezeigt. n = 1 , 2 , 2 2 , 2 4 , 2 8 , 2 16Fnn=1,2,22,24,28,216
Um die Formen dieser Verteilungen zu untersuchen, können wir jede um einen gewissen Betrag nach links verschieben und um , um sie vergleichbar zu machen.a nbneinn
Jedes der vorherigen Diagramme wurde verschoben, um den Median bei und den Bereich der Einheitslänge zwischen den Quartilen festzulegen.0
FTG behauptet, dass die Sequenzen und so gewählt werden können, dass diese Verteilungsfunktionen bei jedem punktweise bis zu einer gewissen Extremwertverteilung konvergieren , bis hin zu Maßstab und Position. Wenn eine Normalverteilung ist, die besondere Begrenzung Extremwertverteilung ist ein Gumbel umgekehrt, bis zu Lage und Maßstab.( b n ) x F( an)( bn)xF
Lösung
Es ist verlockend, den zentralen Grenzwertsatz zu emulieren, indem man standardisiert , dass er einen Einheitsmittelwert und eine Einheitsvarianz aufweist. Dies ist jedoch teilweise unangemessen, da FTG auch für (kontinuierliche) Verteilungen gilt, die keinen ersten oder zweiten Moment haben. Verwenden Sie stattdessen ein Perzentil (wie den Median), um die Position zu bestimmen, und eine Differenz von Perzentilen (wie den IQR), um die Streuung zu bestimmen. (Dieser allgemeine Ansatz sollte erfolgreich sein, und für eine kontinuierliche Verteilung zu finden.)a n b nFneinnbn
Für die Standard-Normalverteilung stellt sich dies als einfach heraus! Es sei . Ein Quantil von , das entspricht, ist ein beliebiger Wert für den . In Erinnerung an die Definition von lautet die LösungF n q x q F n ( x q ) = q F n ( x ) = F n ( x )0 < q< 1FnqxqFn( xq) = qFn( x ) = Fn( x )
xq; n= F- 1( q1 / n) .
Deshalb dürfen wir setzen
bn= x1 / 2 ; n, ein n= x3 / 4 ; n- x1 / 4 ; n; G n( x ) = Fn( anx + bn) .
Denn durch den Bau, der Median der ist und seine IQB ist , der Median des Grenzwertes von (die eine Version eines umgekehrten Gumbel ist) muss und sein IQB muss . Der Parameter scale sei und der Parameter location sei . Da der Median und der IQR leicht zu , müssen die Parameter seinGn01Gn01βαα + βLogLog( 2 )β( logLog( 4 ) - logLog( 4 / 3 ) )
α = logLog2LogLog( 4 / 3 ) - logLog( 4 ); β = 1LogLog( 4 ) - logLog( 4 / 3 ).
Es ist nicht notwendig für und werden genau diese Werte: sie brauchen nur annähernd sie, sofern die Grenze von noch diese umgekehrt Gumbelverteilung. Eine einfache (aber mühsame) Analyse für eine Standardnormale zeigt, dass die NäherungeneinnbnGnF
ein′n= log( ( 4 log2( 2 ) ) / ( log2( 43) ) )2 2 log( n )------√, b ′n= 2 log( n )------√- log( log( n ) ) + log( 4 πLog2( 2 ) )2 2 log( n )------√
wird gut funktionieren (und sind so einfach wie möglich).
Die hellblauen Kurven sind Teilgraphen von für Verwendung der ungefähren Folgen und . Die dunkelrote Linie zeigt die umgekehrte Gumbel-Verteilung mit den Parametern und . Die Konvergenz ist klar (obwohl die Konvergenzrate für negatives merklich langsamer ist).Gnn = 2 , 26, 211, 216ein′nb′nαβx
Verweise
BV Gnedenko, Über die einschränkende Verteilung der maximalen Laufzeit in einer zufälligen Reihe . In Kotz und Johnson, Durchbrüche in Statistik Band I: Grundlagen und grundlegende Theorie, Springer, 1992. Übersetzt von Norman Johnson.