Schätzung anzeigen konvergiert durch Auftragsstatistik zum Perzentil


10

Sei eine Folge von iid-Zufallsvariablen, die aus einer alpha-stabilen Verteilung mit den Parametern α = 1,5 abgetastet wurden.X1,X2,,X3n .α=1.5,β=0,c=1.0,μ=1.0

Betrachten Sie nun die Folge , wobei Y j + 1 = X 3 j + 1 X 3 j + 2 X 3 j + 3 - 1 für j = 0 , , n - 1 .Y1,Y2,,YnYj+1=X3j+1X3j+2X3j+31j=0,,n1

Ich möchte das Perzentil schätzen .0.01

Meine Idee ist es, eine Art Monte-Carlo-Simulation durchzuführen:

l = 1;
while(l < max_iterations)
{
  Generate $X_1, X_2, \ldots, X_{3n}$ and compute $Y_1, Y_2, \ldots, Y_{n}$;
  Compute $0.01-$percentile of current repetition;
  Compute mean $0.01-$percentile of all the iterations performed;
  Compute variance of $0.01-$percentile of all the iterations performed;
  Calculate confidence interval for the estimate of the $0.01-$percentile;

  if(confidence interval is small enough)
    break;

}}

Aufrufen der Mittelwert aller der Probe Perzentile berechnet werden μ n und deren Varianz σ0.01μ^n die entsprechende Konfidenzintervall für berechnenμ, I zum Ortstarke Form des zentralen Grenzwertsatzes:σ^n2μ

Sei eine Folge von iid-Zufallsvariablen mit E [ X i ] = μ und 0 < V [ X i ] = σ 2 < . Definiert die Probe als Mittelwert μ n = ( 1 / N ) Σ n i = 1 X i . Dann ( μ n - μ ) /X1,X2,E[Xi]=μ0<V[Xi]=σ2<μ^n=(1/n)i=1nXi hat eine begrenzende Standardnormalverteilung, dh μ n -μ(μ^nμ)/σ2/n

μ^nμσ2/nnN(0,1).

und Slutksys Theorem, um zu folgern, dass

nμ^nμσ^n2nN(0,1).

Dann a -Konfidenzintervall für μ ist(1α)×100%μ

wobeiz1-α/2das(

Iα=[μ^nz1α/2σ^n2n,μ^n+z1α/2σ^n2n],
z1α/2 -Quantil der Standardnormalverteilung ist.(1α/2)

Fragen:

1) Ist mein Ansatz korrekt? Wie kann ich die Anwendung des CLT rechtfertigen? Ich meine, wie kann ich zeigen, dass die Varianz endlich ist? (Muss ich mir die Varianz von ansehen ? Weil ich nicht denke, dass sie endlich ist ...)Yj

2) Wie kann ich zeigen, dass der Durchschnitt aller Stichproben 0.01 berechneten Perzentile gegen den wahren Wert des Perzentils konvergiert ? (Ich sollte Auftragsstatistiken verwenden, bin mir aber nicht sicher, wie ich vorgehen soll. Referenzen sind willkommen.)0.01


3
Alle Methoden, die unter stats.stackexchange.com/questions/45124 auf Stichprobenmediane angewendet werden, gelten auch für andere Perzentile. Tatsächlich ist Ihre Frage mit dieser identisch, ersetzt jedoch lediglich das 50. Perzentil durch das 1. (oder vielleicht 0,01?) Perzentil.
whuber

@whuber, deine Antwort auf diese Frage ist extrem gut. Glen_b gibt jedoch am Ende seines Beitrags (die akzeptierte Antwort) an, dass die ungefähre Normalität "nicht für extreme Quantile gilt, weil die CLT dort nicht eintritt (der Durchschnitt der Zs wird nicht asymptotisch normal sein) ). Sie benötigen eine andere Theorie für Extremwerte ". Wie besorgt sollte ich über diese Aussage sein?
Maya

2
Ich glaube, er meinte nicht wirklich extreme Quantile , sondern nur die Extreme selbst. (Tatsächlich korrigierte er diesen Fehler am Ende desselben Satzes und bezeichnete sie als "Extremwerte".) Der Unterschied besteht darin, dass ein extremes Quantil wie das 0,01-Perzentil (das das untere 1/10000 des Verteilung) wird sich im Grenzfall stabilisieren, da immer mehr Daten in einer Stichprobe immer noch unter und immer mehr über dieses Perzentil fallen. Bei einem Extrem (wie dem Maximum oder Minimum) ist dies nicht mehr der Fall.
whuber

Dies ist ein Problem, das im Allgemeinen mithilfe der empirischen Prozesstheorie gelöst werden sollte. Eine Hilfe zu Ihrem Ausbildungsstand wäre hilfreich.
AdamO

Antworten:


2

YXα=3/2μYσ2Xi

σ2=Var(Y)=E(Y2)E(Y)2=E(X12X22X32)E(X1X2X3)2=E(X2)3(E(X)3)2=(Var(X)+E(X)2)3μ6=(Var(X)+μ2)3μ6.

Var(X)Var(X)


Wenden wir uns der zweiten Frage zu.

Jedes Probenquantil konvergiert gegen das wahre Quantil, wenn die Probe groß wird. Die nächsten Absätze belegen diesen allgemeinen Punkt.

q=0.0101FZq=F1(q)qth

F1ϵ>0q<qq+>q

F(Zqϵ)=q,F(Zq+ϵ)=q+,

ϵ0[q,q+]{q}

nZq(q,n)qZqnZqnqnq(1q)Φnq

1Φ(nqnqnq(1q))=1Φ(nqqq(1q)).

ΦnnΦ1

nqZqnqZq+qZqϵZq+ϵ

ϵ1αnnq1αϵZq


q=0.50

Abbildung: Histogramm von 0,01 Quantilen von Y mit n = 300 für 1000 Iterationen

q=0.01Yn=300Y

library(stabledist)
n <- 3e2
q <- 0.01
n.sim <- 1e3

Y.q <- replicate(n.sim, {
  Y <- apply(matrix(rstable(3*n, 3/2, 0, 1, 1), nrow=3), 2, prod) - 1
  log(-quantile(Y, 0.01))
})
m <- median(-exp(Y.q))
hist(Y.q, freq=FALSE, 
     main=paste("Histogram of the", q, "quantile of Y for", n.sim, "iterations" ),
     xlab="Log(-Y_q)",
     sub=paste("Median is", signif(m, 4), 
               "Negative log is", signif(log(-m), 4)),
     cex.sub=0.8)
abline(v=log(-m), col="Red", lwd=2)
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.