Ordnungsstatistik (z. B. Minimum) der unendlichen Sammlung von Chi-Quadrat-Variablen?


11

Dies ist mein erstes Mal hier. Bitte lassen Sie mich wissen, ob ich meine Frage in irgendeiner Weise klären kann (einschließlich Formatierung, Tags usw.). (Und hoffentlich kann ich später bearbeiten!) Ich habe versucht, Referenzen zu finden und mich mithilfe der Induktion zu lösen, bin aber bei beiden gescheitert.

Ich versuche , eine Verteilung zu vereinfachen , die zu einer Ordnungsstatistik einer abzählbar unendlichen Menge unabhängiger zu reduzieren scheint Zufallsvariablen mit verschiedenen Freiheitsgraden; Was ist konkret die Verteilung des ten kleinsten Wertes unter unabhängigen ?χ2mχ22,χ42,χ62,χ82,

Mich würde der Sonderfall interessieren : Wie ist die Verteilung des Minimums von (unabhängigen) ?m=1χ22,χ42,χ62,

Für den Fall des Minimums konnte ich die kumulative Verteilungsfunktion (CDF) als unendliches Produkt schreiben, aber nicht weiter vereinfachen. I verwendet , um die Tatsache , daß die CDF von χ2m2 ist

F2m(x)=γ(m,x/2)/Γ(m)=γ(m,x/2)/(m1)!=1ex/2k=0m1xk/(2kk!).
(Mit m=1 bestätigt dies den zweiten Kommentar zur Äquivalenz mit einer Exponentialverteilung mit Erwartung 2.) Die CDF des Minimums kann dann geschrieben werden als = 1 - m = 1 ( e - x / 2
Fmin(x)=1(1F2(x))(1F4(x))=1m=1(1F2m(x))
=1m=1(ex/2k=0m1xk2kk!).
Der erste Term im Produkt ist nur ex/2 und der "letzte" Term istex/2k=0xk/(2kk!)=1 . Aber ich weiß nicht, wie ich es (wenn möglich?) Von dort aus vereinfachen soll. Oder vielleicht ist ein ganz anderer Ansatz besser.

Eine weitere potenziell hilfreiche Erinnerung: χ22 einer Exponentialverteilung mit Erwartung 2, und χ42 ist die Summe zweier solcher Exponentiale usw.

Wenn jemand neugierig ist, versuche ich, Satz 1 in diesem Artikel für den Fall der Regression auf einer Konstanten zu vereinfachen ( xi=1 für alle i ). (Ich habe χ2 anstelle von Γ Verteilungen, da ich mit 2 \ kappa multipliziert habe 2κ.)


Ist dies Ihre Frage beantwortet?
mpiktas

@mpiktas: danke für den vorschlag. Es ist ähnlich, außer dass ich anstelle von Exponentialen mit unterschiedlichen Ratenparametern Chi-Quadrate mit unterschiedlichen Freiheitsgraden habe (und eine unendliche Anzahl von ihnen, nicht endlich). Und während ein Exponential ist, sind nicht; Sie sind Summen von Exponentialen, aber Summen von Exponentialen sind selbst nicht exponentiell. (Und im Idealfall hoffe ich auf eine allgemeine Ordnungsstatistik, obwohl die min ein guter Start wäre.) χ 2 4 , χ 2 6 , χ22χ42,χ62,
David M Kaplan

1
Ich bezweifle, dass es dafür eine geschlossene Form gibt. Es hat jedoch eine merkwürdige Charakterisierung: Wenn iid Poisson ( ) variiert, , dann ist die Chance, dass alle . Xkλ/2k=1,2,1Fmin(λ)Xkk
whuber

1
@whuber: Es ist vielleicht nicht ganz so neugierig, wenn man an einen Poisson-Prozess denkt, mit dem ich gespielt habe. Sei iid Zufallsvariablen mit dem entsprechenden Poisson-Prozess der Rate . Sei , , usw. Dann sind die unabhängig und durch die stationäre Eigenschaft unabhängiger Inkremente eines Poisson-Prozesses wir habe das . T1,T2,Exp(1/2)N(t):=sup{n:i=1nTit}1/2U1=T1U2=T2+T3U3=T4+T5+T6Uiχ2i2P(Uit)=P(N(t)i)
Kardinal

@ Cardinal Natürlich: Das ist eine gute Möglichkeit, es zu sehen. Die Neugier liegt nicht in der Beziehung zwischen Poissons und Gammas; es liegt in der Beschreibung des Ereignisses selbst!
whuber

Antworten:


8

Die Nullen des unendlichen Produkts sind die Vereinigung der Nullen der Terme. Die Berechnung bis zum 20. Semester zeigt das allgemeine Muster:

plot of complex zeros

Diese Darstellung der Nullen in der komplexen Ebene unterscheidet die Beiträge der einzelnen Terme im Produkt anhand verschiedener Symbole: Bei jedem Schritt werden die scheinbaren Kurven weiter erweitert und eine neue Kurve noch weiter links gestartet.

Die Komplexität dieses Bildes zeigt, dass es keine geschlossene Lösung für bekannte Funktionen der höheren Analyse gibt (wie Gammas, Thetas, hypergeometrische Funktionen usw. sowie die Elementarfunktionen, wie sie in einem klassischen Text wie Whittaker untersucht wurden & Watson ).

Daher könnte das Problem etwas fruchtbarer gestellt werden : Was müssen Sie über die Verteilung der Auftragsstatistik wissen? Schätzungen ihrer charakteristischen Funktionen? Momente niedriger Ordnung? Annäherungen an Quantile? Etwas anderes?


Warum sind Nullen des Produkts von Bedeutung? Ich habe das Gefühl, etwas Triviales zu vermissen.
mpiktas

2
@mp Die Nullen und Pole zeigen etwas über die Komplexität der Funktion. Rationale Funktionen haben eine endliche Anzahl von ihnen. Elementarfunktionen haben typischerweise eine Reihe von Nullen, wie zum Beispiel bei , n Integral für exp ( ) ; Typische "transzendentale" Funktionen haben etwas komplexere Muster von Nullen, wie bei allen nicht positiven ganzen Zahlen (Kehrwert der Gammafunktion) oder auf einem Gitter von Punkten (Theta-Funktionen und elliptische Funktionen). Das hier gezeigte komplizierte Muster legt nahe, dass es schwierig oder unmöglich sein wird, die CDF in Bezug auf diese bekannten Funktionen auszudrücken. 2iπnnexp()
whuber

2
@whuber (1/2), danke! Ich wusste nichts über die verschiedenen Funktionsklassen mit diesen verschiedenen Nullenmustern in der komplexen Ebene. das klingt sehr nützlich und Ihr Diagramm scheint meine Frage zu beantworten (wie gestellt).
David M Kaplan

@whuber (2/2), dies überprüfte einen Sonderfall einer (komplizierten) Verteilung eines Schätzers, der in einem anderen Artikel angegeben wurde. Sie nutzten die Existenz der Distribution, um die Verwendung von Bootstrap zu rechtfertigen. Mein Berater schlug vor, die Verteilung zu approximieren. Es scheint, als ob ihre Verteilung für diesen Sonderfall (wo ich weiß, was es sein sollte) nicht möglich ist, also werde ich nach Ablauf seiner Bewilligungsfrist mit meinem Berater Kontakt aufnehmen. aber möglicherweise würde ich versuchen, eine Erweiterung höherer Ordnung des ten Ordnungsstatus (geteilt durch m ) als m in einer komplizierteren Umgebung zu nehmen. Werde wieder posten, wenn ja; Danke noch einmal! mmm
David M Kaplan

3

Wie ist die Verteilung des Minimums von (unabhängig) ?χ22,χ42,χ62,

Entschuldigung für die verspätete Ankunft um 6 Jahre. Obwohl sich das OP jetzt wahrscheinlich anderen Problemen zugewandt hat, bleibt die Frage frisch, und ich dachte, ich könnte einen anderen Ansatz vorschlagen.


Wir erhalten wobei X iChisquared ( v i ) ist, wobei v i = 2 i mit pdf's f i ( x i ) ist :(X1,X2,X3,)XiChisquared(vi)vi=2ifi(xi)

enter image description here

Hier ist eine grafische Darstellung der entsprechenden pdf-Dateien mit zunehmender Stichprobengröße für i = 1  bis  8 :fi(xi)i=1 to 8

enter image description here

min(X1,X2,X3,)

Jedes Mal, wenn wir einen zusätzlichen Begriff hinzufügen, verschiebt sich das PDF des zuletzt hinzugefügten Randbegriffs immer weiter nach rechts, so dass der Effekt des Hinzufügens von immer mehr Begriffen nicht nur immer weniger relevant wird, sondern bereits nach wenigen Begriffen wird fast vernachlässigbar - auf das Probenminimum. Dies bedeutet im Endeffekt, dass wahrscheinlich nur eine sehr kleine Anzahl von Begriffen tatsächlich eine Rolle spielt ... und das Hinzufügen zusätzlicher Begriffe (oder das Vorhandensein einer unendlichen Anzahl von Begriffen) für das Mindestproblem der Stichprobe weitgehend irrelevant ist.

Prüfung

min(X1,X2,X3,)OrderStatNonIdentical1stjivi

enter image description here enter image description here

Es wird etwas kompliziert, wenn die Anzahl der Begriffe zunimmt ... aber ich habe die Ausgabe für 1 Begriff (1. Zeile), 2 Begriffe (2. Zeile), 3 Begriffe (3. Zeile) und 4 Begriffe oben gezeigt.

Das folgende Diagramm vergleicht das PDF des Stichprobenminimums mit 1 Begriff (blau), 2 Begriffen (orange), 3 Begriffen und 10 Begriffen (rot). Beachten Sie, wie ähnlich die Ergebnisse mit nur 3 Begriffen gegenüber 10 Begriffen sind: enter image description here

Das folgende Diagramm vergleicht 5 Begriffe (blau) und 10 Begriffe (orange) - die Diagramme sind so ähnlich, dass sie sich gegenseitig auslöschen, und man kann nicht einmal den Unterschied erkennen:

enter image description here

Mit anderen Worten, eine Erhöhung der Anzahl der Terme von 5 auf 10 hat fast keinen erkennbaren visuellen Einfluss auf die Verteilung des Stichprobenminimums.

Halblogistische Annäherung

Schließlich ist die halblogistische Verteilung mit pdf eine ausgezeichnete einfache Annäherung an das PDF der Stichprobe min:

g(x)=2ex(ex+1)2 for x>0

Das folgende Diagramm vergleicht die genaue Lösung mit 10 Begriffen (die nicht von 5 Begriffen oder 20 Begriffen zu unterscheiden sind) und der halblogistischen Näherung (gestrichelt):

enter image description here

Das Erhöhen auf 20 Begriffe macht keinen erkennbaren Unterschied.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.