Verteilungsklassen unter maximal geschlossen


11

Sei eine Klasse von Wahrscheinlichkeitsverteilungen auf nicht negativen Realzahlen, die durch parametrisiert sind , so dass Ich frage mich, welche bekannten Verteilungsklassen unter der Annahme des Maximums geschlossen werden und dh ob und sind unabhängig dann .Qpp

Qp([0,))=1.
X1Qp1X2Qp2max(X1,X2)Qp3

2
Suchen Sie nach einer mathematischen Charakterisierung solcher Klassen oder fragen Sie sich, welche der allgemein bekannten parametrischen Verteilungsfamilien diese Eigenschaft haben könnte?
whuber


@whuber Alle drei Extremwerttypen arbeiten nach dem unten angegebenen Argument. Ich zeige jedoch nicht, dass sie die einzigen sind.
Michael R. Chernick

Der Powerpoint von Stoev, den Whuber zitiert, zeigt das Ergebnis, das ich für diese Llya-Verteilungen gegeben habe, die als maxi-stabil bezeichnet werden, und der in der Präsentation zitierte Satz besagt außerdem, dass sie die einzigen sind.
Michael R. Chernick

@Michael Haben Sie die Beschränkung auf nicht negative Werte in der Frage bemerkt? Dies schließt die Extremwertverteilungen aus, die die negativen Realwerte positiv unterstützen.
whuber

Antworten:


12

Es scheint mir, dass das Vorschlagen von Extremwertverteilungen wirklich eine andere Frage beantwortet. Ich werde zeigen, dass die direkte Beantwortung und Darstellung dieser Frage zu Verteilungen führt, die nicht zu den Extremwerttypen gehören.

Betrachten wir dies anhand der ersten Prinzipien. Es ist unmittelbar, aus den Axiomen der Wahrscheinlichkeit und der Definition der CDF, dass die Verteilung der maximal zwei unabhängige Zufallsvariablen mit CDF und hat für seine CDF. Angenommen, es existiert eine Verteilungsklasse , die unter dem paarweisen Maximum geschlossen wird. das ist,F1F2F1F2Ω={Fθ}

FθΩ, FϕΩ implies FθFϕΩ.

Es ist zweckmäßig, Logarithmen zu verwenden und die reellen Zahlen (wie in Rudins erweiterten Analysetexten) so zu erweitern, dass sie als Protokoll von . Protokolle von CDFs von Zufallsvariablen, die im Wesentlichen auf sind (i) mononotisch nicht ansteigend, (ii) gleich auf , (iii) haben rechte Grenzen von und ( iv) sind Cadlag. Unter diesem Gesichtspunkt muss eine konvexe Teilmenge eines Kegels im Raum der Cadlag-Funktionen auf . Damit dieser Kegel endlich parametrisiert werden kann, muss er einen endlichdimensionalen Vektorunterraum erzeugen. Das lässt noch viele Möglichkeiten.0[0,)(,0)0ΩR

Einige dieser Möglichkeiten sind bekannt. Betrachten Sie zum Beispiel die CDF einer einheitlichen Variablen auf . Seine CDF ist gleich on , wenn und on . Der Kegel, den es erzeugt, ist der Satz von CDFs des Formulars[0,1]0(,0]x0x11[1,)

Fθ(x)=exp(θlog(x))=xθ,0<x<1

parametrisiert durch . Es ist klar, dass das Maximum von zwei unabhängigen Zufallsvariablen mit Verteilungen in dieser Familie auch in dieser Familie eine Verteilung hat (ihre Parameter addieren sich einfach). Wenn wir möchten, können wir uns auf eine konvexe Teilmenge der Form und haben immer noch eine maximal geschlossene Familie. Beachten Sie bitte, dass kein Mitglied dieser Familie eine Extremwertverteilung ist.θ>0{Fθ|θθ0}

Diese Formulierung enthält diskrete Verteilungen (die offensichtlich nicht zu den drei Arten von Extremwertverteilungen gehören). Betrachten Sie zum Beispiel die Verteilungen, die auf den natürlichen Zahlen für die die Wahrscheinlichkeiten gegeben sind0,1,2,,k,

Prθ(k)=θ1/(k+1)θ1/k

(unter wenn ), parametrisiert durch . Konstruktionsbedingt ist die CDF , woraus sie folgtθ1/k=0k=00<θ<1Fθ(k)=θ1/(k+1)

Fθ(k)Fϕ(k)=θ1/(k+1)ϕ1/(k+1)=(θϕ)1/(k+1),

und weil die Annahmen implizieren , zeigt dies, dass die Familie unter paarweisen Maxima geschlossen ist.0<θϕ<1

Ich hoffe, dass diese Analyse und diese beiden Beispiele zeigen, dass entgegen einer in einem Kommentar geäußerten Meinung der Ansatz darin besteht, mit einer endlichen Anzahl gut ausgewählter CDFs zu beginnen und diese in Bezug auf das paarweise Maximum zu schließen (dh ihre Kegel zu bilden) in einem geeigneten verwandten Vektorraum) ist nicht nur konstruktiv, sondern liefert interessante und potenziell nützliche Verteilungsklassen.


3
+1 für diese Analyse und Überprüfung der Interpretation von Extremwertverteilungen.

1
@whuber: Vielen Dank für die Aufmerksamkeit, die diesem Problem geschenkt wurde. Ich habe wirklich nicht so viele nette Antworten erwartet (und ich werde alle begrüßen, die geantwortet haben). Die Kegel- (oder Halbgruppen-) Konstruktion, die Sie angegeben haben, ist in der Tat wahr: Wenn eine Familie von Verteilungen ist, hat sein Abschluss (wrt ) jedes Element der Form wobei und . Leider wurde mir klar, dass auch eine Verschiebung des Schließens erforderlich ist (dh wenn dann ). Soll ich dafür eine neue Frage stellen? Fθmax(Fθ1α1××Fθnαn)αi0nNF(x)ΩF(xa)Ω
Ilya

1
Das ist sicherlich eine Komplikation, Ilya. Bevor Sie jedoch etwas ändern oder eine neue Frage stellen, überlegen Sie bitte, wie Sie die Schichtschließungsanforderung mit der (scheinbar widersprüchlichen) Anforderung in Einklang bringen würden, dass alle Variablen nicht negative Unterstützung haben! (Ich denke, Sie müssen die möglichen Werte von einschränken .)a
whuber

Nicht im Zusammenhang mit dieser Frage, aber auf der Suche nach Beispielen für Familien, die unter dem Produkt stabil sind.
Vincent Granville

1
@Vincent Betrachten Sie zunächst jede Familie von additiv geschlossenen Zufallsvariablen und potenzieren Sie sie. Multiplizieren Sie für eine reichhaltigere Familie eine dieser Variablen mit einer unabhängigen Rademacher-Variablen (erhalten Sie Variablen, die auf der gesamten reellen Linie und nicht nur auf den positiven Zahlen unterstützt werden). U
whuber

10

Hinweis: Bei dieser Antwort wird davon ausgegangen, dass die Variablen identisch verteilt sind und nicht nur nach derselben Klasse verteilt sind.

Das wären die Extremwertverteilungen . Es gibt drei davon, wie sie normalerweise dargestellt werden, die drei Sätzen von Bedingungen für die zugrunde liegende Verteilung entsprechen, für die die Grenzverteilung des Maximums gefunden wird. Sie werden geschlossen, wenn Sie das Maximum finden, was Sie wollen.

Mehr oder weniger Kopieren aus einer alten Version von Methoden der statistischen Analyse für Zuverlässigkeits- und Lebensdaten (Mann, Schafer, Singpurwalla),

Typ I: FX(n)(x)=exp{exp[xγα]}, <x<, α>0

Typ II: FX(n)(x)=exp{(xγα)β}, xγ, α,β>0

Typ III: FX(n)(x)=exp{[(xγα)β]}. xγ, α,β>0

Bearbeiten: Lesen Sie die Kommentare, die diese Antwort erweitern, um eine deutlich verbesserte und vollständigere Antwort auf diese Frage zu erhalten!


3
+1 Die Typen I und III gelten jedoch nicht für die Frage.
whuber

Ganz richtig (+1), ich beantwortete eine allgemeinere Frage, ohne den Unterschied zu erklären. Außerdem hätte ich die Normalisierung beschreiben müssen, die stattfinden muss, um Entartung zu verhindern, wie Sie es in Ihrem Kommentar zur Antwort von MC unten getan haben. Lehre mich, diese Antworten zu schreiben, wenn ich aus der Tür gehe! (
Nun

1
@whuber Ich frage wahrscheinlich etwas Offensichtliches, aber ist es wahr, dass wenn und und sie unabhängig sind, dann ? X1Frechet(α1,β1)X2Frechet(α2,β2)max(X1,X2)Frechet(α3,β3)

2
Das ist eine gute Frage, @Procrastinator. Ich konnte mir keinen Grund vorstellen, warum ein solches Ergebnis wahr sein sollte, also simulierte ich 1.000.000 iid-Werte von Frechet und 1.000.000 iid-Werte von Frechet und berechnete ihre paarweisen Maxima. Die Ergebnisse können von keiner Frechet- Distribution angepasst werden - auch nicht annähernd . Sie benötigen alle drei Parameter (einschließlich des Standortparameters), um diese Familie unter Maxima zu schließen. Dann - Emulieren eines (unvollständigen) Arguments in Michael Chernicks Antwort - können Sie zeigen, dass skaliert Frechet skaliert werden muss. (3,1)(10,1)(α,β)max(X1,X2)
whuber

Diese Antwort ist falsch. Der Extremwertsatz gilt, wenn die Verteilungen der Variablen identisch sind, die Frage jedoch besagt, dass sie nur zur selben Klasse gehören müssen (sie können unterschiedliche Parameter haben).
user76284

0

Jbowman schlug mich auf die Antwort. Eine Erklärung dafür, warum sie funktionieren, ist, dass der Satz von Gnedenko besagt, dass wenn eine Folge von unabhängigen identisch verteilten Zufallsvariablen unter bestimmten Bedingungen am Ende von ist Die Verteilung konvergiert gegen einen der drei Typen, die jbowman in seiner Antwort aufgeführt hat. Da nun jede Verteilung vom Typ I, Typ II oder Typ III als Grenze des Maximums einer iid-Sequenz ausgedrückt werden kann, gilt als Typ I und als Grenzverteilung von da gegen unendlich tendiert und ebenfalls Typ I ist und die Grenze vonX1,,XnnMn=max(X1,X2,,Xn)G1Mn=max(X1,X2,,Xn)nG2Nn=max(Y1,Y2,dotsc,Yn)dann sage und ist die Verteilung der Grenze, wenn für geht, dann ist Typ I und ist die Verteilung für das Maximum eines rv mit der Verteilung und eines anderen mit der Verteilung und daher ist Typ I unter Maximierung geschlossen. Das gleiche Argument gilt für Typ II und Typ III.Vn=max(Mn,Nn)G3nVnG3G1G2


2
Für die unbegrenzten Verteilungen konvergiert das Maximum nicht: es divergiert mit . Wie beim CLT ist eine entsprechende Normalisierung erforderlich. (Aus diesem Grund ist es wichtig, Standort- und Skalierungsparameter in diese Familien aufzunehmen.) Gnedenkos klassisches Papier zu diesem Thema beginnt (wenn ich mich richtig erinnere) mit der Frage, ob eine Reihe von affinen Koeffizienten so gefunden werden kann, dass konvergiert. Nachdem er dies festgestellt hat, erhält er die möglichen Formen der Begrenzungsverteilung. nan,bnaMn+bn
whuber

In allen Fällen hätte ich angemessen normalisieren sollen. Vielen Dank. Selbst im begrenzten Fall muss man sich normalisieren, um das Limit zu erreichen (ich denke, ich sollte mich daran erinnern, meine Dissertation war extrem! Aber vor 34 Jahren)
Michael R. Chernick

3
Beachten Sie auch, dass die Extremwertverteilungen die Frage nicht erschöpfend beantworten. (Dies ist keine Kritik, sondern nur eine Beobachtung.) Wenn wir beispielsweise auf die natürlichen Zahlen beschränken, können wir als gleichmäßige Verteilung auf . Diese Klasse wird unter dem Maximum ( ) geschlossen, aber kein Mitglied davon ist eine Extremwertverteilung. pQp[p,p+1]max(Qp,Qr)Qmax(p,r)
whuber

@whuber alle drei Typen sind unbegrenzte Fälle, aber der kurzschwänzige Typ III enthält begrenzte Fälle wie die gleichmäßige Verteilung. Für U [0,1] konvergiert P [Mn <= 1-x / n] gegen exp (-x), da P [Mn <= 1-x / n] = (1-x / n) ^ n.
Michael R. Chernick

3
Ihre Antworten scheinen in dem Beispiel, das ich gegeben habe, nicht relevant zu sein, Michael. Der Unterschied besteht darin, dass diese Frage nicht nach zählbaren Sequenzen von iid-Variablen oder sogar nach zählbaren Sequenzen von irgendetwas fragt; es fragt nur über Schließung unter Paaren von Variablen , die haben in der Regel unterschiedliche Verteilungen. (Aber jetzt sehe ich, dass es in meinem Beispiel einen Fehler gibt: das Maximum, wenn nicht mehr einheitlich ist, also müsste ich die Familie angemessen erweitern, um Maxima von beliebig vielen iid-Uniformen einzuschließen.)p=r
whuber
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.