Schätzung anzeigen konvergiert durch Auftragsstatistik zum Perzentil

Sei eine Folge von iid-Zufallsvariablen, die aus einer alpha-stabilen Verteilung mit den Parametern abgetastet $X_1, X_2, \ldots, X_{3n}$ . $\alpha = 1.5, \; \beta = 0, \; c = 1.0, \; \mu = 1.0$

Betrachten Sie nun die Folge , wobei für . $Y_1, Y_2, \ldots, Y_{n}$ $Y_{j+1} = X_{3j+1}X_{3j+2}X_{3j+3} - 1$ $j=0, \ldots, n-1$

Ich möchte das Perzentil schätzen . $0.01-$

Meine Idee ist es, eine Art Monte-Carlo-Simulation durchzuführen:

l = 1;
while(l < max_iterations)
{
  Generate $X_1, X_2, \ldots, X_{3n}$ and compute $Y_1, Y_2, \ldots, Y_{n}$;
  Compute $0.01-$percentile of current repetition;
  Compute mean $0.01-$percentile of all the iterations performed;
  Compute variance of $0.01-$percentile of all the iterations performed;
  Calculate confidence interval for the estimate of the $0.01-$percentile;

  if(confidence interval is small enough)
    break;

}}

Aufrufen der Mittelwert aller der Probe Perzentile berechnet werden und deren Varianz $0.01-$ $\hat{\mu}_n$ die entsprechende Konfidenzintervall für berechnen, I zum Ortstarke Form des zentralen Grenzwertsatzes: $\hat{\sigma}^{2}_{n}$ $\mu$

Sei eine Folge von iid-Zufallsvariablen mit und . Definiert die Probe als Mittelwert . Dann $X_1, X_2, \ldots$ $E \left[ X_i \right] = \mu$ $0 < V \left[ X_i \right] = \sigma^2 < \infty$ $\hat{\mu}_n = (1/n) \sum_{i=1}^n X_i$ hat eine begrenzende Standardnormalverteilung, dh $(\hat{\mu}_n - \mu) / \sqrt{\sigma^{2}/n}$
$\frac{{\hat{μ}}_{n} - μ}{\sqrt{σ^{2} / n}} \overset{n \to \infty}{⟶} N (0, 1) .$ $\frac{\hat{\mu}_n - \mu}{\sqrt{\sigma^{2}/n}} \overset{n \rightarrow \infty} \longrightarrow N(0,1).$

und Slutksys Theorem, um zu folgern, dass

\sqrt{n} \frac{{\hat{μ}}_{n} - μ}{\sqrt{{\hat{σ}}_{n}^{2}}} \overset{n \to \infty}{⟶} N (0, 1) .

$\sqrt{n} \frac{\hat{\mu}_n - \mu}{\sqrt{\hat{\sigma}^{2}_{n}}} \overset{n \rightarrow \infty} \longrightarrow N(0,1).$

Dann a -Konfidenzintervall für ist $(1-\alpha)\times 100\%$ $\mu$

wobeidas

I_{α} = [{\hat{μ}}_{n} - z_{1 - α / 2} \sqrt{\frac{{\hat{σ}}_{n}^{2}}{n}}, {\hat{μ}}_{n} + z_{1 - α / 2} \sqrt{\frac{{\hat{σ}}_{n}^{2}}{n}}],

$I_{\alpha} = \left[\hat{\mu}_n - z_{1- \alpha / 2} \sqrt{\frac{\hat{\sigma}^{2}_{n}}{n}} , \hat{\mu}_n + z_{1- \alpha / 2} \sqrt{\frac{\hat{\sigma}^{2}_{n}}{n}} \right],$

z_{1 - α / 2}

$z_{1- \alpha / 2}$

-Quantil der Standardnormalverteilung ist.

(1 - α / 2)

$(1- \alpha / 2)$

Fragen:

1) Ist mein Ansatz korrekt? Wie kann ich die Anwendung des CLT rechtfertigen? Ich meine, wie kann ich zeigen, dass die Varianz endlich ist? (Muss ich mir die Varianz von ansehen ? Weil ich nicht denke, dass sie endlich ist ...) $Y_j$

2) Wie kann ich zeigen, dass der Durchschnitt aller Stichproben $0.01-$ berechneten Perzentile gegen den wahren Wert des Perzentils konvergiert ? (Ich sollte Auftragsstatistiken verwenden, bin mir aber nicht sicher, wie ich vorgehen soll. Referenzen sind willkommen.) $0.01-$

— Maya
quelle

Alle Methoden, die unter stats.stackexchange.com/questions/45124 auf Stichprobenmediane angewendet werden, gelten auch für andere Perzentile. Tatsächlich ist Ihre Frage mit dieser identisch, ersetzt jedoch lediglich das 50. Perzentil durch das 1. (oder vielleicht 0,01?) Perzentil.

— whuber

@whuber, deine Antwort auf diese Frage ist extrem gut. Glen_b gibt jedoch am Ende seines Beitrags (die akzeptierte Antwort) an, dass die ungefähre Normalität "nicht für extreme Quantile gilt, weil die CLT dort nicht eintritt (der Durchschnitt der Zs wird nicht asymptotisch normal sein) ). Sie benötigen eine andere Theorie für Extremwerte ". Wie besorgt sollte ich über diese Aussage sein?

— Maya

Ich glaube, er meinte nicht wirklich extreme Quantile , sondern nur die Extreme selbst. (Tatsächlich korrigierte er diesen Fehler am Ende desselben Satzes und bezeichnete sie als "Extremwerte".) Der Unterschied besteht darin, dass ein extremes Quantil wie das 0,01-Perzentil (das das untere 1/10000 des Verteilung) wird sich im Grenzfall stabilisieren, da immer mehr Daten in einer Stichprobe immer noch unter und immer mehr über dieses Perzentil fallen. Bei einem Extrem (wie dem Maximum oder Minimum) ist dies nicht mehr der Fall.

— whuber

Dies ist ein Problem, das im Allgemeinen mithilfe der empirischen Prozesstheorie gelöst werden sollte. Eine Hilfe zu Ihrem Ausbildungsstand wäre hilfreich.

— AdamO

$Y$ $X$ $\alpha=3/2$ $\mu$ $Y$ $\sigma^2$ $X_i$

\begin{aligned} σ^{2} = Var (Y) & = E (Y^{2}) - E (Y)^{2} \\ = E (X_{1}^{2} X_{2}^{2} X_{3}^{2}) - E (X_{1} X_{2} X_{3})^{2} \\ = E (X^{2})^{3} - {(E (X)^{3})}^{2} \\ = {(Var (X) + E (X)^{2})}^{3} - μ^{6} \\ = {(Var (X) + μ^{2})}^{3} - μ^{6} . \end{aligned}

$\eqalign{ \sigma^2 = \operatorname{Var}(Y) &= \mathbb{E}(Y^2) - \mathbb{E}(Y)^2 \\ &= \mathbb{E}(X_1^2X_2^2X_3^2) - \mathbb{E}(X_1X_2X_3)^2 \\ &= \mathbb{E}(X^2)^3 - \left(\mathbb{E}(X)^3\right)^2 \\ &= \left(\operatorname{Var}(X) + \mathbb{E}(X)^2\right)^3 - \mu^6 \\ &= \left(\operatorname{Var}(X) + \mu^2\right)^3 - \mu^6. }$

$\operatorname{Var}(X)$ $\operatorname{Var}(X)$

Wenden wir uns der zweiten Frage zu.

Jedes Probenquantil konvergiert gegen das wahre Quantil, wenn die Probe groß wird. Die nächsten Absätze belegen diesen allgemeinen Punkt.

$q=0.01$ $0$ $1$ $F$ $Z_q=F^{-1}(q)$ $q^{\text{th}}$

$F^{-1}$ $\epsilon\gt 0$ $q_-\lt q$ $q_+\gt q$

F (Z_{q} - ϵ) = q_{-}, F (Z_{q} + ϵ) = q_{+},

$F(Z_q - \epsilon) = q_-,\quad F(Z_q + \epsilon) = q_+,$

$\epsilon\to 0$ $[q_-, q_+]$ $\{q\}$

$n$ $Z_{q_-}$ $(q_-, n)$ $q_-$ $Z_{q_-}$ $n$ $Z_{q_-}$ $nq_-$ $nq_-(1-q_-)$ $\Phi$ $nq$

1 - Φ (\frac{n q - n q_{-}}{\sqrt{n q_{-} (1 - q_{-})}}) = 1 - Φ (\sqrt{n} \frac{q - q_{-}}{\sqrt{q_{-} (1 - q_{-})}}) .

$1-\Phi\left(\frac{nq - nq_-}{\sqrt{nq_-(1-q_-)}}\right) = 1-\Phi\left(\sqrt{n}\frac{q - q_-}{\sqrt{q_-(1-q_-)}}\right).$

$\Phi$ $\sqrt{n}$ $n$ $\Phi$ $1$

$nq$ $Z_{q_-}$ $nq$ $Z_{q_+}$ $q$ $Z_q-\epsilon$ $Z_q+\epsilon$

$\epsilon$ $1-\alpha$ $n$ $nq$ $1-\alpha$ $\epsilon$ $Z_q$

$q=0.50$

$q=0.01$ $Y$ $n=300$ $Y$

library(stabledist)
n <- 3e2
q <- 0.01
n.sim <- 1e3

Y.q <- replicate(n.sim, {
  Y <- apply(matrix(rstable(3*n, 3/2, 0, 1, 1), nrow=3), 2, prod) - 1
  log(-quantile(Y, 0.01))
})
m <- median(-exp(Y.q))
hist(Y.q, freq=FALSE, 
     main=paste("Histogram of the", q, "quantile of Y for", n.sim, "iterations" ),
     xlab="Log(-Y_q)",
     sub=paste("Median is", signif(m, 4), 
               "Negative log is", signif(log(-m), 4)),
     cex.sub=0.8)
abline(v=log(-m), col="Red", lwd=2)

— whuber
quelle